﻿Cu aproximativ de caractere, punctele de cod sunt o resursă foarte rară nu sunt distribuite cu mare grijă Aproximativ jumătate dintre coduri sunt deja în H|n*d , pentru acest tip de tranzistor acesta este de obicei + V Dacă Vm depășește valoarea aritmetică, tranzistorul pornește și acționează ca un conductor, tu- іyіііnv vі ііmіmіmіm semnal V (prin convenție, acesta este O B) +Vcc a b c Orez Invertor cu tranzistori (a); poarta NU ȘI ( ); NU SAU poarta (c) Este important de reținut că, dacă tensiunea V este scăzută, atunci este ridicată și invers Circuitul eni este astfel un invertor care transformă logic și /sud și logic în logic Este nevoie de un rezistor (linie întreruptă) pentru a limita curentul care trece prin tranzistor, astfel încât tranzistorul i să se ardă Trecerea de la o stare la alta durează de obicei mai puțin de / nanosecunde Pe fig , b două tranzistoare sunt conectate în serie Dacă atât tensiunea Vt, cât și tensiunea V sunt mari, atunci ambele tranzistoare devin conductori și reduc V Dacă una dintre tensiunile de intrare este scăzută, atunci tranzistorul i corespunzător se oprește și tensiunea de ieșire devine ridicată Cu alte cuvinte, V este scăzut dacă și numai dacă atât V, cât și V sunt mari Pe fig , două tranzistoare sunt conectate în paralel Dacă una dintre intrări este ridicată, tranzistorul corespunzător pornește și reduce ieșirea Dacă ambele tensiuni de intrare sunt scăzute, atunci tensiunea de ieșire devine ridicată Aceste trei circuite formează trei porți simple Ele sunt numite porți NOT, NAND și, respectiv, NOR Porțile NU sunt adesea denumite invertoare Vom folosi ambii termeni Dacă acceptăm convenția conform căreia tensiunea înaltă (Vgg) este un logic și tensiunea joasă ("masa") este un logic, atunci putem exprima valoarea la ieșire în funcție de intrare valorile pufului Pictogramele care sunt folosite pentru a descrie aceste trei tipuri de supape sunt prezentate în fig și c Acolo sunt prezentate și modurile de funcționare ale funcției pentru fiecare schemă În aceste figuri, A și B sunt semnale de intrare, X este semnalul de ieșire Fiecare rând de tabel definește un semnal de ieșire pentru diferite combinații de semnale de intrare A X Și în X Și în X în X Și în X A b c d e Orez Pictograme pentru reprezentarea celor cinci supape principale Moduri de funcționare pentru fiecare supapă Dacă semnalul de ieșire din Fig , b alimentează invertorul, obținem un alt circuit opus porții NAND, adică un astfel de circuit în care semnalul de ieșire este dacă și numai dacă ambele semnale de intrare sunt Un astfel de circuit se numește poartă AND; reprezentarea sa schematică și descrierea funcției corespunzătoare sunt date în fig , d În mod similar, o poartă NOR poate fi conectată la un invertor Apoi obținem un circuit al cărui semnal de ieșire este egal cu dacă cel puțin unul dintre semnalele de intrare este unitate și egal cu dacă ambele semnale de intrare sunt glonț O imagine a acestui circuit, care se numește o poartă SAU, precum și o descriere a funcției corespunzătoare, sunt date în fig , e Cercurile mici din circuitele invertorului, porții NAND și porții NOR sunt numite ieșiri inversoare Ele pot fi folosite și în alte contexte pentru a se referi la un semnal inversat Cele cinci supape prezentate în fig formează baza nivelului logic digital Ar trebui să fie clar din discuția de mai sus că porțile NAND și NOR necesită câte doi tranzistori fiecare, iar porțile AND și OR necesită câte trei tranzistoare Din acest motiv, multe computere folosesc porți NAND și NOR mai degrabă decât porți AND și OR (În practică, toate porțile sunt construite oarecum diferit, dar porțile NAND și NOR sunt oricum mai simple decât AND și SAU ) Trebuie menționat că porțile pot avea mai mult de două intrări În principiu, o poartă NAND, de exemplu, poate avea un număr arbitrar de intrări, dar în practică, de obicei, nu există mai mult de opt Deși proiectarea supapelor este la nivelul dispozitivelor fizice, vom menționa în continuare principalele linii de tehnologii de fabricație, deoarece acestea sunt adesea menționate în literatură Cele două tehnologii principale sunt bipolare și MOS (metal, oxid, semiconductor) Tehnologiile bipolare includ TTL (logica tranzistor-tranzistor), care a servit drept bază pentru electronica digitală de mulți ani, și ECL (emitter-coupled) porţi şi ouleva algeora | B), care este utilizat în cazurile în care sunt necesare operațiuni de mare viteză În ceea ce privește circuitele de calcul, MES este mai comună -neptile sunt mai lente decât TTL și ESL, dar consumă mult mai multă energie și ocupă mult mai puțin spațiu, astfel încât să poți pune un număr mare de astfel de supape într-o manieră compactă Supapele MOS sunt disponibile într-o varietate de varietăți: MOS cu canal p, MOS cu canal p și MOS complementar Deși MOSFET-urile nu sunt proiectate ca Histori bipolari, ele pot funcționa și ca comutatoare electronice, alte procesoare și memorie sunt cel mai adesea fabricate folosind MOSFET-uri complementare, care funcționează la - V ota-B Atât ce putem spune despre nivel a dispozitivelor fizice ■GGyp •li care doresc să afle mai multe despre acest nivel se pot referi la litera-Mg furnizată pe site-ul cărții Lea Algebra Pentru a descrie circuite obținute prin combinarea diferitelor porți, aveți nevoie de un tip special de algebră în care toate variabilele și funcțiile pot lua doar valori: și O astfel de algebră se numește booleană Ea este numită după Matematicianul englez George Boole ( - ) De fapt, în acest tutorial vorbim despre un tip special de algebră booleană, și anume, algebra circuitelor re-Multi, dar termenul "algebră booleană" este foarte des folosit în sensul "Shіgebra circuitelor relee", deci nu vom face distincție între ele La fel ca algebra obișnuită (adică cea care se studiază la școală), CLITBR boolean are propriile sale funcții O funcție booleană ia una sau mai multe variabile ca intrare și produce un rezultat care depinde doar de valorile acelor Do|m'mends Se poate defini o funcție simplă / spunând că f(A) = dacă A - și f(A) = dacă A = O astfel de funcție ar fi o funcție NOT (vezi Fig , a) Deoarece o funcție booleană de n variabile are doar combinații posibile de valori variabile, o astfel de funcție poate fi descrisă complet printr-un tabel cu n rânduri Fiecare linie va da valoarea funcției pentru diferite combinații de valori variabile Un astfel de tabel se numește tabel de adevăr Toate tabelele din fig sunt tabele de adevăr Dacă suntem de acord să aranjam întotdeauna rândurile tabelului de adevăr în ordine numerică, adică pentru două variabile în ordinea , , , AND, atunci funcția poate fi complet descrisă printr-un număr binar de "biți, care este obţinute prin citirea verticală a coloanei rezultat din adevărul tabelului Astfel, NAND este , NOR este , AND este și OR este Evident, există doar funcții booleene a două variabile, care corespund la șiruri posibile de biți În algebra obișnuită, dimpotrivă, există un număr infinit de funcții a două variabile și niciuna dintre ele nu poate fi descrisă printr-un tabel de valori ale acestei funcții pentru toate valorile admisibile ale variabilelor de intrare, deoarece fiecare variabilă poate lua un număr infinit de valori Pe fig , a arată tabelul de adevăr pentru o funcție booleană a trei variabile: M = f(A, Bt C) Aceasta este funcția majoritară, care ia Valoarea este dacă majoritatea variabilelor sunt , sau dacă majoritatea variabilelor sunt Deși orice funcție booleană poate fi definită folosind un tabel de adevăr, acest tip de notație devine greu de utilizat pe măsură ce numărul de variabile crește Prin urmare, în loc de tabele de adevăr, este adesea folosită o altă notație A în cu m A b Orez Tabelul de adevăr pentru funcția majoritară a trei variabile (a); schema de implementare a acestei funcții (b) Pentru a vedea acest alt tip de notație, rețineți că orice funcție booleană poate fi definită și prin specificarea combinațiilor de valori ale variabilelor de intrare care au ca rezultat o singură valoare a funcției Pentru funcția din fig , dar există combinații de variabile care dau o singură valoare a funcției Vom desena o bară peste variabilă pentru a indica faptul că valoarea acesteia este inversată Absența unei liniuțe înseamnă că valoarea variabilei nu este inversată În plus, vom folosi semnul de înmulțire (punct) pentru a reprezenta funcția booleană AND (acest semn poate fi omis) și semnul de adunare (+) pentru a reprezenta funcția booleană SAU De exemplu, ABC este numai dacă A = , B = și C = De asemenea, AB + BC este numai dacă (L = și B = ) sau (B = și C = ) În tabelul din fig , iar funcția ia valoarea în patru linii: ABC, ABC, ABC și ABC Funcția M la- ia o valoare adevărată (adică ) dacă una dintre aceste patru condiții este adevărată Eu 'іі'adovatelyіo, putem scrie M = ABC + ABC + ABC + ABC Aceasta este o notație compactă a tabelului de adevăr Astfel, o funcție de n variabile poate fi descrisă printr-o "suma" de cel mult L "produse", iar fiecare "produs" va avea n factori După cum vom vedea în scurt timp, această formulare este deosebit de importantă deoarece permite implementarea acestei funcții folosind porți standard Este important să înțelegem diferența dintre o funcție booleană abstractă și implementarea ei cu un circuit electronic O funcție booleană constă din variabile precum L, B și C, precum și din operatori AND, OR și NOT O funcție booleană este evaluată folosind un tabel de adevăr sau o notație specială, de exemplu: F - ABC + ABC O funcție booleană poate fi implementată de un circuit electronic (adesea în diferite moduri) folosind semnale care reprezintă variabile de intrare și ieșire și porți precum AND, OR și NOT Implementarea funcţiilor booleene Kick a remarcat mai devreme că reprezentarea unei funcții booleene ca o sumă de cel mult n produse duce direct la o posibilă implementare a celei de-a doua funcții Pe fig , b, semnalele de intrare L, B și C sunt afișate în partea stângă, funcția L / obținută la ieșire este afișată în dreapta Deoarece variabilele de intrare trebuie inversate, semnalul trece prin invertoarele , și Pentru a clarifica figura, am trasat linii verticale, dintre care sunt asociate cu variabilele de intrare, altele cu inversiunile acestora Aceste linii furnizează semnal de intrare ig|M'ing către porți De exemplu, porțile , și primesc un semnal A la intrarea lor Într-un circuit real, aceste porți ar fi probabil conectate direct la A fără fire verticale între ele Circuitul conține patru porți AND, câte una pentru fiecare termen din ecuația pentru M (adică una pentru fiecare rând din tabelul de adevăr cu un rezultat de ) Fiecare poartă AND evaluează unul dintre rândurile specificate ale tabelului de adevăr În final, toate aceste produse sunt însumate (adică operația SAU) pentru a obține rezultatul final I (uitați-vă la Fig , b În această carte vom folosi următoarea convenție: dacă două linii din figură se intersectează, conexiunea este implicită numai dacă există un punct aldine la intersecție De exemplu, ieșirea supapei traversează toate cele linii verticale, dar este legat doar de linia C () Rețineți că alte cărți pot folosi convenții diferite Din fig ar trebui să fie clar cum să obțineți schema pentru orice funcție booleană: Faceți un tabel de adevăr pentru această funcție Includeți invertoare în circuit pentru a putea inversa fiecare semnal de intrare Desenați o poartă AND pentru fiecare rând al tabelului de adevăr cu rezultatul Conectați porțile AND la semnalele de intrare corespunzătoare Ieșiți ieșirile tuturor porților AND și direcționați-le către intrarea porții SAU Am arătat cum să implementăm orice funcție booleană folosind porțile NOT, AND și OR Cu toate acestea, este mult mai convenabil să construiți circuite folosind un singur tip de poartă Din fericire, circuitele construite conform algoritmului anterior sunt ușor convertite în formă NAND sau NOR Tot ceea ce este necesar pentru a implementa o astfel de transformare este implementarea porților NOT, AND și OR folosind orice tip de poartă Pe fig arată cum să faceți acest lucru pe baza porților NAND sau NOR (Această conversie este elementară, dar există și alte opțiuni ) b c Orez Construcția porților NOT (a), AND (b) și OR (c) numai pe baza porților NAND sau NOR Pentru a implementa o funcție booleană bazată doar pe porți NAND sau NOR, puteți urma mai întâi algoritmul descris prin construirea unui circuit cu porți NOT, AND și OR Apoi, trebuie să înlocuiți supapele cu mai multe porturi cu circuite echivalente pe ventile cu două porturi De exemplu, A + B + C + D poate fi schimbat în (A + B) + (C + D) folosind trei porți cu două sensuri Apoi porțile NOT, AND și OR sunt înlocuite cu circuitele prezentate în fig Deși această procedură nu conduce la circuite optime în ceea ce privește numărul minim de porți, ea demonstrează că o astfel de transformare este fezabilă Porțile NAND și NOR sunt considerate complete deoarece există porți și algebră booleană Funcția poate fi implementată pe baza lor Nicio altă supapă nu are această proprietate, motiv pentru care aceste două tipuri de supape sunt preferate la construirea circuitelor schemă lentitudine Proiectanții de circuite încearcă adesea să reducă numărul de porți pentru a reduce spațiul curent ocupat de circuit, a reduce consumul de energie etc supape simple, de exemplu, cu două căi cu patru căi) Algebra booleană este un instrument valoros în schemele per-valente Ca exemplu de utilizare al algebrei booleene, luați în considerare schema și tipurile ta pentru funcția AB + AC (Fig , a) Deși nu suntem încă siguri, multe dintre regulile algebrei generale se aplică și algebrei booleene ), expresia AB + AC conform legii distributive poate fi transformată în B + C) Pe fig , b arată schema și tabelul de adevăr pentru o funcție Două funcții sunt echivalente dacă și numai dacă ambele funcții iau aceeași valoare pentru toate variabilele posibile Dintre cele blitz-uri de adevăr din Fig arată clar că funcția A(JB + C) este echivalentă cu funcția AB + AC În ciuda acestei echivalențe, circuitul din Fig , b este mai simplu decât circuitul din fig a, deoarece conține mai puține porți A c AB AC AB + AC A în c A în + c A (B + C) a b Orez Două funcții echivalente: AB + AC (a); A(B + C) (b) iwv ilaaa i CIFRIVIA NIVEL LEGIC De obicei, un dezvoltator pornește de la o anumită funcție booleană și apoi îi aplică legile algebrei booleene pentru a găsi o funcție mai simplă echivalentă cu cea originală Pe baza funcției obținute se poate construi sistem Pentru a utiliza această abordare, trebuie să cunoașteți câteva relații (legi) ale algebrei booleene, care sunt prezentate în tabel Este interesant de observat că fiecare raport are două forme O formă poate fi derivată din alta; schimbând AND la SAU și la Toate relațiile pot fi dovedite cu ușurință prin compilarea tabelelor lor de adevăr În aproape toate cazurile, rezultatele sunt clare, cu excepția relației De Morgan, a relației de absorbție și a relației de distribuție Relația lui De Morgap poate fi extinsă la expresii cu mai mult de două variabile, cum ar fi ABC = A + B + C Tabelul Câteva relații de algebră booleană Raport ȘI SAU Relația de identitate IA \u d A + A \u d A Raportul zero OA = + A = Relația de neputință AA = A A + A = A Raportul de inversiune AA = A +Â= Relația de comutativitate AB = BA A + B = B + A Raport asociativ (AB)C \u d A (BC) (A + B) + C \u d A + (B + C) Relația de distribuție A + BC = (A + B)(A + C) A(B + C) = AB + AC Raportul de absorbție A(A + B) = A A + AB = A Raportul lui De Morgan AB = A + B A + B = AB Raportul lui De Morgan sugerează o notație alternativă Pe fig , iar forma AND este dată cu negație, care este prezentată folosind intrări și ieșiri inversate Astfel, o poartă SAU cu intrări inversate este echivalentă cu o poartă NAND Din fig b, care ilustrează a doua formă a relației De Morgan, este clar că în loc de o poartă NOR, se poate desena o poartă AND cu intrări inversate Prin negarea ambelor forme ale relației De Morgan, ajungem la reprezentări echivalente ale porților AND și OR (Fig , c, d) Reprezentări simbolice similare există pentru diferite forme ale relației De Morgan (de exemplu, o poartă NAND cu intrare w devine o poartă SAU cu intrări inversate) Folosind ecuațiile prezentate în fig și ecuații similare pentru porțile cu mai multe intrări, se poate converti cu ușurință suma produselor în forma numai de porți NAND sau numai de porți NOR Ca exemplu, luați în considerare funcția SAU EXCLUSIV (Fig , a) Schema standard care exprimă suma produselor este prezentată în fig b Pentru a ajunge la forma NAND, trebuie să desenați linii care conectează ieșirile porților AND cu intrarea porții SAU, cu intrări și ieșiri inversoare, ca AB A+B A+B Orez Reprezentări alternative ale unor porți: NAND (a); NU-SAU (b); Si in); SAU (g) ін"к;і іаі i() în fig , c Apoi, pe baza fig , a, ajungem la fig , d Variabilele A și B pot fi obținute din L și B folosind porți NAND sau III' OR cu intrări combinate Rețineți că intrările (ieșirile) inversoare se pot deplasa opțional de-a lungul liniei de comunicație, de exemplu, de la ieșirile porții de intrare la intrările porții de ieșire A B XOR A în g Orez Tabel de adevăr pentru funcția SAU EXCLUSIV (a) Trei scheme pentru calcularea acestei funcții (b-d) Rămâne de remarcat faptul că aceeași poartă fizică poate calcula diferite funcții în funcție de convențiile utilizate Pe fig și am arătat semnalele de ieșire ale porții F pentru diferite combinații de semnale de intrare Atât semnalele de intrare, cât și de ieșire sunt date în volți Dacă acceptăm ("convenția conform căreia V este un zero logic și , V sau V este unul logic, obținem tabelul de adevăr prezentat în Fig , , adică funcția AND Un astfel de acord se numește logică pozitivă Cu toate acestea, dacă acceptăm logica negativă, adică suntem de acord că OB este o unitate logică și , V sau V este un zero logic, atunci vom obține tabelul de adevăr prezentat în Fig , c, adică, funcția SAU În F s s s s ov V OV V V V V V V A A la F b în F V Orez Caracteristicile electrice ale dispozitivului (a); logica pozitiva (b); logica negativa (c) Astfel, totul depinde de ce convenție este aleasă pentru afișarea tensiunilor în mărimi logice În această carte, ne vom limita în mare parte la logica pozitivă, astfel încât termenii "boolean ", "adevărat" și "mare" sunt considerați sinonimi, la fel ca termenii "boolean ", "fals" și "scăzut" Circuite logice digitale de bază Acum știm cum să implementăm tabele de adevăr și să construim circuite simple din porți individuale În practică, circuitele logice digitale sunt foarte rar construite poartă cu poartă, deși această abordare a fost cândva obișnuită Acum, blocurile standard de "construcții" sunt module care combină mai multe supape În următoarele subsecțiuni, ne vom uita la aceste blocuri de construcție mai detaliat și vom vedea cum sunt utilizate și cum să le construim din porți individuale circuite integrate Supapele nu sunt fabricate și vândute individual, ci în module numite circuite integrate (CI) sau microcircuite Un circuit integrat este o bucată pătrată de siliciu, a cărei dimensiune depinde de numărul de porți necesare implementării componentelor Circuitele integrate mici sunt de obicei în jur de mm x mm, cele mai mari pot fi în jur de mm x mm Microcircuitele sunt de obicei plasate în pachete de plastic sau ceramică dreptunghiulare semnificativ mai mari dacă microcircuitul necesită mulți pini pentru a comunica cu lumea exterioară Fiecare pin este conectat la intrarea sau ieșirea unei porți, la o sursă de alimentare sau la masă circuite logice digitale de bază ■і Nm fig prezintă câteva opțiuni comune pentru pachetele ■Mroschem Pentru microcircuite mici (de exemplu, cele utilizate în microcontrolere sau circuite de memorie), se folosesc pachete Dual Inline Package (DIP) - pachete cu două rânduri de Cmvod-uri introduse în prizele corespunzătoare de pe placa de bază De obicei, DIP-uri cu , , , , , , , , sau de pini Pentru circuitele mari ISC, se folosesc adesea pachete, în care cablurile sunt amplasate pe cele patru laturi sau de jos Două pachete comune pentru circuitele integrate mai mici sunt PGA (Pin Grid Argy) și LGA (Land Grid Argal) Pentru carcasele PGA, pinii sunt localizați în partea de jos a carcasei și sunt incluși în pinii corespunzători de pe placa de bază Prizele PGA folosesc adesea un mecanism de forță de inserție zero; cu alte cuvinte, PGA alunecă în priză fără efort, după ce împingerea pârghiei aplică presiune pe toți pinii PGA, iar micro-eChem-ul este ținut ferm în priză Cipurile LGA au plăcuțe de contact pe suprafața inferioară a MPUS-ului, iar soclu-ul LGA are un capac, care presează cipul pe placă și asigură contactul între plăcuțele LGA și plăcuțele soclului V Iisus Principalele tipuri de pachete pentru circuite integrate: DIP (a), PGA ( } și LGA (s) Pachetele de cipuri au adesea o formă simetrică, așa că atunci când le instalați, există întotdeauna probleme cu alegerea orientării Pachetele DIP au de obicei o crestătură pe o parte, care ar trebui să corespundă semnului de pe soclul - P Pachetele PGA nu au de obicei un pin, așa că o încercare de a introduce incorect un PGA într-un soclu este sortită eșecului Deoarece pachetele LGA nu au pini, instalarea corectă este asigurată prin plasarea crestăturilor pe una sau ambele părți ale LGA Dacă crestăturile nu se potrivesc cu cheile din soclul LGA, cipul nu se va potrivi în soclu Pentru comoditate, presupunem că ieșirea porții se schimbă de îndată ce semnalul de la intrarea acesteia se schimbă De fapt, există o anumită întârziere de poartă, care include timpul de trecere a semnalului prin microcircuit și timpul de comutare Latența este de obicei de la sute de picosecunde la câteva nanosecunde Acum este posibil să puneți până la miliard de tranzistori pe un singur cip Deoarece orice circuit poate fi construit din porți NAND, s-ar putea avea impresia că producătorul este capabil să facă Nu uita de legea lui Moore Miezul procesorului Pentium IV conține deja de milioane de tranzistori și evident, aceasta nu este limita - Notă științific ed io>" ilvv □ logica digitala nivelul un microcircuit care conține de porți NAND mototolite Din păcate, pentru a crea un astfel de microcircuit, sunt necesari de pini Întrucât distanța standard între pini este de mm, cipul LGA va avea o lungime de peste m, ceea ce este susceptibil să-i afecteze negativ capacitatea de comercializare De aceea, pentru a profita de această tehnologie, este necesar să se dezvolte circuite în care numărul de porțile depășesc semnificativ numărul de pini În următoarele subsecțiuni, ne vom uita la microcircuite simple * în care, pentru a calcula o anumită funcție, mai multe porți sunt conectate între ele într-un anumit mod, ceea ce ne permite să reducem numărul de pini externi Scheme combinatorii Multe aplicații ale logicii digitale necesită circuite cu mai multe intrări și mai multe ieșiri în care semnalele de ieșire sunt determinate de semnalele de intrare curente O astfel de schemă se numește combinatorie Nu toate schemele au această proprietate De exemplu, un circuit care conține elemente de memorie poate genera semnale de ieșire care depind de valorile stocate în memorie Un microcircuit care implementează un tabel de adevăr (de exemplu, prezentat în Fig , a) este un exemplu tipic de circuit combinatoriu În această secțiune, vom analiza cele mai frecvent utilizate scheme combinatorii Multiplexoarele La nivel logic digital, multiplexorul este un circuit cu L intrări, o ieșire și n linii de control care vă permit să selectați una dintre intrări Intrarea selectată este conectată la ieșire Pe fig prezintă o diagramă a unui multiplexor cu opt intrări Cele trei linii de control A, B și C codifică un număr de biți care specifică care dintre cele opt linii de intrare trebuie conectată la poarta SAU și, prin urmare, la ieșire Indiferent de valoarea pe liniile de control, șapte porți AND vor scoate întotdeauna , iar cea rămasă poate scoate sau , în funcție de valoarea liniei de intrare selectate Fiecare poartă AND este declanșată de o combinație specifică de semnale pe liniile de control Circuitul multiplexor este prezentat în fig Folosind un multiplexor, putem implementa funcția majoritară (vezi Figura a) așa cum se arată în Figura b Pentru fiecare combinație de A, B și C, se selectează una dintre liniile de intrare Fiecare intrare este conectată fie la semnalul V (logic ), sau cu masă (logic ) Algoritmul conexiunii de intrare este foarte simplu: intrarea Dt este aceeași cu valoarea din rândul i al tabelului de adevăr Pe fig , iar în liniile , , și valoarea funcției este , deci intrările corespunzătoare sunt împământate; în rândurile rămase, valoarea funcției este , deci intrările corespunzătoare sunt conectate la una logică În acest fel, pe baza microcircuitului din Fig , dar puteți implementa orice tabel de adevăr cu trei variabile Am văzut deja cum poate fi folosit un multiplexor pentru a selecta una dintre mai multe intrări și cum permite construirea unui tabel de adevăr Este de asemenea circuite logice digitale ionice ii Orez Diagrama unui multiplexor cu opt căi A Vcc b Orez Multiplexor cu opt intrări (a); același multiplexor montat pentru a calcula funcția majoritară (b) poate fi folosit ca convertor paralel-serial Dacă aplicați biți de date liniilor de intrare și apoi comutați alternativ liniile de control pentru a obține valori de la OOO la (acestea sunt numere binare), atunci biți vor merge la linia de ieșire în serie În mod obișnuit, această conversie se realizează la introducerea informațiilor de la tastatură, deoarece fiecare apăsare de tastă determină un număr de sau biți care ar trebui transmis secvenţial prin linia telefonică Opusul unui multiplexor este un demultiplexor, care conectează un singur semnal de intrare la una dintre ieșirile de ", în funcție de valorile semnalelor din cele n linii de control Dacă valoarea binară a liniilor de control este k, atunci ieșirea k este selectată Decodoare Ca un al doilea exemplu, luați în considerare un circuit care ia un număr de n biți ca intrare și îl folosește pentru a selecta (adică, setat la ) una dintre cele n linii de ieșire Un astfel de circuit se numește decodor Un exemplu de decodor pentru n = este prezentat în fig Orez Schema unui decodor care conține intrări și Ѳ ieșiri Pentru a înțelege de ce este nevoie de un decodor, imaginați-vă o memorie formată din opt cipuri, fiecare conținând MB Cipul are adrese de la la MB, cipul are adrese de la la MB și așa mai departe Cei mai importanți trei biți ai adresei sunt utilizați pentru a selecta unul dintre cele opt cipuri Pe fig acești trei biți sunt cele trei intrări I, B și C În funcție de semnalele anodice, exact una dintre cele opt linii de ieșire (Do, /> ) primește shnchgiiis ; liniile rămase iau valoarea Fiecare linie de ieșire induce unul dintre cele opt cipuri de memorie Deoarece o singură linie este setată la , este activat un singur cip Principiul de funcționare al circuitului prezentat în Fig nu este dificil Fiecare ven-inii Și are trei intrări, dintre care prima este A sau L, a doua este B sau B, repet C sau (? Fiecare poartă este declanșată de o combinație diferită de intrări: /> (| combinație de A B C, Di - combinație de A B C și etc Comparatoare Un alt circuit util este un comparator Comparatorul compară două cuvinte care sunt introduse Comparatorul prezentat în fig ia două intrări A și B de biți fiecare și iese dacă sunt egale și dacă stps-urile nu sunt egale Circuitul se bazează pe o poartă EXCLUSIVĂ SAU care scoate dacă intrările sunt egale și dacă intrările nu sunt egale Dacă toate cele patru cuvinte de intrare sunt egale, toate cele patru porți SAU EXCLUSIVE ar trebui să iasă Aceste patru semnale sunt apoi introduse în poarta SAU Dacă rezultatul este , atunci cuvintele de intrare sunt egale; si in rest nu sunt egali În exemplul nostru, am folosit o poartă OR ca finală pentru a schimba valoarea rezultatului: I înseamnă egal, înseamnă inegalitate Exclusiv-sau poarta ao În Orez Comparator simplu pe biți Scheme aritmetice Să trecem de la scheme de uz general la scheme combinatorii, care sunt folosite pentru a efectua operații aritmetice Reamintim că pentru circuitele combinaționale, starea ieșirilor este o funcție de starea semnalului de intrare lov, dar circuitele folosite pentru a efectua operații aritmetice nu au această proprietate Vom începe cu un simplu shifter de biți, apoi ne uităm la structura sumătorilor și, în final, vom privi unitățile logice aritmetice, care joacă un rol esențial în orice computer Scheme de forfecare Primul circuit aritmetic pe care îl vom analiza este circuitul de schimbare cu intrări și ieșiri (Figura ) Opt biți de intrare sunt dați pe liniile , Dr Datele de ieșire, care sunt datele de intrare deplasate cu un bit, sunt alimentate pe liniile , , Sr Linia de control C determină direcția deplasării: - stânga, - corect O schimbare la stânga inserează un în bitul În mod similar, o schimbare la dreapta inserează o valoare de în bitul Do Di D D D D De D Deci S S S S S Se S Orez Schema de schimburi Pentru a înțelege cum funcționează un astfel de circuit, luați în considerare perechile de porți AND (cu excepția celor extreme) Dacă C = , membrul drept al fiecărei perechi este pornit, trecând bitul corespunzător prin el însuși Deoarece poarta ȘI dreapta este conectată la intrarea porții SAU, care este situată în dreapta acestei porți ȘI, are loc o deplasare la dreapta Dacă C \u d , poarta ȘI stânga a perechii este activată, apoi are loc o deplasare la stânga Aditivi Un computer care nu poate adăuga numere întregi este practic de neconceput Prin urmare, circuitul pentru efectuarea operațiilor de adăugare este o parte esențială a oricărui procesor Tabelul de adevăr pentru adăugarea numerelor întregi cu o singură cifră este prezentat în fig a Există două rezultate aici: suma variabilelor de intrare A și B și un transfer la următoarea poziție (stânga) Circuitul de calcul al bitului de sumă și al bitului de transport este prezentat în fig b Un astfel de circuit este de obicei numit semi-adunator Jumătatea de adunare este potrivită pentru adăugarea biților inferiori ai două cuvinte cu mai mulți biți Cu toate acestea, nu este potrivit pentru adăugarea de biți în mijlocul unui cuvânt, deoarece nu poate fi transportat în acea poziție Prin urmare, un complet Exclusiv-sau poarta Sumă Transfer Orez Tabel de adevăr pentru adăugarea numerelor dintr-o singură cifră (a); circuit semirumator (b) i^mmmtor (Fig ) Ar trebui să fie clar din diagramă că sumatorul complet este format din două jumătăți de sumatori Suma este egală cu dacă transferul unui număr impar de variabile A, B și nu ia valoarea (adică dacă una dintre cele trei sau toate trei este egală cu unul) Ieșirea de transfer este setată la dacă fie A și B ndHiii reme sunt (intrarea din stânga la poarta SAU) sau unul dintre ele este și ziua) de transfer este, de asemenea, Cele două jumătăți de sumare generează ambii biți de sumă, Eu port biți Intrare B Transfer în Sumă Transfer Out transfer a b Orez Tabelul de adevăr pentru sumatorul complet (a); circuit adunator complet ( ) Pentru a construi un sumator, de exemplu, pentru două cuvinte de biți, trebuie să duplicați circuitul prezentat în Fig ori b Transportul se face spre bitul adiacent stâng Un transfer la bitul din dreapta este conectat la Un astfel de sumator se numește un sumător de transfer Adăugarea la numărul ns va fi efectuată până când transportul merge până la capăt de la bitul din dreapta la cel din stânga Există sumatoare mai rapide care funcționează fără această întârziere Desigur, li se acordă preferință Luați în considerare un exemplu de adăugare mai rapidă Să împărțim sumatorul pe de biți în două jumătăți: cel de jos pe biți și cel de sus pe biți Când începe adăugarea, sumatorul superior nu poate începe încă să funcționeze, deoarece nu cunoaște valoarea transportului și nu va putea afla până când nu se fac însumări în sumatorul inferior Cu toate acestea, puteți face o singură modificare a schemei În loc de un sumator superior, puteți obține două sumatoare superioare prin duplicarea părții corespunzătoare a echipamentului Apoi circuitul va fi format din trei sumatoare pe biți: unul inferior și două superioare [ și VV] care funcționează în paralel Ca transfer, intră în sumatorul , iar intră în sumatorul Ul Ambele sumatoare superioare încep să lucreze simultan cu sumatorul inferior, dar numai unul dintre rezultatele însumării celor doi sumatori superioare va fi corect După adăugarea celor cifre inferioare, valoarea transferului către suma superioară devine cunoscută, iar apoi poate fi determinat răspunsul corect Cu această abordare, timpul de adăugare se reduce la jumătate Un astfel de adunator este numit un adunator carry-select Puteți împărți din nou fiecare sumator pe biți în două sumătoare pe biți și așa mai departe Unități aritmetice logice Majoritatea calculatoarelor conțin un singur circuit pentru efectuarea operațiilor AND, SAU și adunare pe două cuvinte mașină De obicei, acest circuit pentru cuvintele //-bit constă din n circuite identice, câte unul pentru fiecare poziţie de bit Pe fig prezintă un astfel de circuit, care se numește unitate logică aritmetică (ALU) Acest dispozitiv poate calcula una dintre următoarele funcții: A AND B, A SAU B, B sau A + B Alegerea funcției depinde de ce semnale sunt recepționate pe liniile B () și F}: , , sau Și (în sistemul de numere binar) Rețineți că aici A + B înseamnă suma aritmetică a lui A și B, nu operația logică AND În colțul din stânga jos al circuitului este un decodor pe doi biți care generează semnale de pornire pentru patru operațiuni Alegerea funcționării este determinată de semnalele de control B() și Fv În funcție de valorile lui Bo și F^, se selectează una dintre cele patru linii de activare, iar apoi semnalul de ieșire al funcției selectate trece prin ultima SAU poarta În colțul din stânga sus al diagramei se află un dispozitiv logic pentru calcularea funcțiilor A ȘI B, A SAU B și B, dar doar unul dintre aceste rezultate trece prin ultima poartă SAU, în funcție de care dintre liniile de activare a ales decodorul Deoarece exact una dintre ieșirile decodorului poate fi , exact una dintre cele patru porți AND se va declanșa Cele trei porți rămase vor scoate indiferent de valorile lui A și B dispozitiv logic Transfer de intrare Ieșire transfer Orez Un singur bit ALU ALU poate efectua nu numai operații logice și aritmetice asupra variabilelor L și B, ci și să le facă egale cu zero prin negarea ENA (enable signal A) sau ENB (enable signal B) De asemenea, puteți obține A setând semnalul INVA (inversează A) De ce sunt necesare ENA, ENB și INVA, vom vedea în Capitolul În condiții normale, atât ENA, cât și ENB sunt pentru a permite ambele intrări, iar INVA este În acest caz, A și B merg pur și simplu la logica unitate fără modificări În colțul din dreapta jos este o sumătoare completă pentru calcularea sumei A și /J, precum și pentru efectuarea transferurilor Semnificațiile sunt necesare deoarece mai multe astfel de circuite pot fi conectate pentru a efectua operații pe cuvinte întregi Circuite cu un singur bit precum cel prezentat în Fig sunt numite secțiuni de microprocesor R-row Acestea permit dezvoltatorului să construiască un ALU de orice capacitate Pe fig prezintă o diagramă a unei ALU pe biți, compusă din opt secțiuni pe un singur bit Semnalul INC (incrementare cu unu) este necesar doar pentru operațiuni de adăugare Face posibilă calcularea sumelor albastre precum A + și A + B + transfer transfer Orez Opt secțiuni cu un singur bit conectate pentru a forma un ALU de biți Pentru a simplifica circuitul, semnalele de activare și inversare nu sunt afișate I În urmă cu câțiva ani, o secțiune cu un singur bit era un adevărat cip pe care îl puteai cumpăra În zilele noastre, este mai mult o bibliotecă pe care designerul de cipuri o dublează de câte ori este necesar în software-ul CAD; programul produce un fișier de ieșire care controlează echipamentul de fabricare a cipurilor Cu toate acestea, ideea generală a rămas neschimbată Generatoare de ceas În multe circuite digitale, totul depinde de ordinea operațiilor Uneori o operație trebuie să precedă alta, alteori două operații trebuie să aibă loc în același timp Pentru a controla parametrii de sincronizare, generatoarele de ceas sunt încorporate în circuitele digitale pentru a asigura sincronizarea Un generator de ceas este un circuit care provoacă o serie de impulsuri Toate impulsurile au aceeași durată Intervalele dintre impulsurile succesive sunt de asemenea aceleași Intervalul de timp dintre începutul unui impuls și începutul următorului se numește timp takt Frecvența pulsului este de obicei între MHz și GHz, corespunzând unui ciclu de ceas de până la ps Frecvența oscilatorului ceasului este de obicei controlată de un oscilator cu cristal de înaltă precizie Multe lucruri se pot întâmpla într-un computer într-un singur ciclu de ceas Dacă urmează să fie efectuate într-o anumită ordine, atunci măsura ar trebui împărțită în subcicluri Pentru a obține o rezoluție mai bună decât ceasul principal, trebuie să ramificați linia principală a ceasului și să introduceți un circuit cu un anumit timp de întârziere Așa se generează un semnal secundar al generatorului de ceas, defazat față de cel primar (Fig , a) Diagrama de timp prezentată în fig , b, oferă patru puncte de origine pentru evenimente discrete: Front Cr Declin în Cr Fata C Recesiune C Prin asocierea diferitelor evenimente cu diferite scăderi (fronturi și recesiuni), puteți realiza succesiunea dorită de acțiuni Dacă sunt necesare mai mult de patru puncte de referință în pre-/|gchih a unui ciclu, mai multe ramuri pot fi făcute din linia principală cu timpi de întârziere diferiți A b II) III III V Orez Generator de ceas (a); diagrama de timp a generatorului de ceas (b); generarea de impulsuri de ceas asincrone (a) În unele circuite, intervalele de timp sunt importante, nu timpii discreti De exemplu, un eveniment poate să apară nu în fața IIV'Isa, ci în orice moment când nivelul impulsului C este ridicat Un alt eveniment poate avea loc numai atunci când nivelul impulsului lui S este ridicat I і /іi, sunt necesare mai mult de două intervale, trebuie furnizate mai multe linii de ceas sau stările de impuls înalt-jos ale celor două ceasuri trebuie să se suprapună parțial în timp În acest din urmă caz, se pot distinge intervale separate: Generatoarele de ceas pot fi sincrone În acest caz, timpul de existență și novație a unui impuls cu un nivel ridicat este egal cu timpul de existență a unui impuls cu un nivel scăzut (vezi Fig , b) Pentru a obține o serie asincronă de impulsuri-i pn (a se vedea semnalul C în Fig , c), trebuie să deplasați semnalul oscilatorului principal, ІН folosind circuitul de întârziere Apoi semnalul primit este conectat la originalul i igіalom folosind funcția logică AND Memorie Memoria este o componentă necesară a oricărui computer Fără memorie, nu ar exista computere, cel puțin nu cele pe care le avem astăzi Memoria este folosită pentru a stoca atât comenzi, cât și date În următoarele subsecțiuni, noi ne uităm la principalele componente ale dentului, începând de la nivelul supapelor Vom vedea cum funcționează, cum pot fi construite cu o capacitate mare Încuietori Pentru a crea un bit de memorie, aveți nevoie de un circuit care să "suprascrie" cumva valorile anterioare de intrare Un astfel de circuit poate fi construit cu două porți NOR, așa cum se arată în Fig a Circuite similare pot fi construite din porți NAND Nu vom menționa aceste circuite în continuare, deoarece sunt în esență identice cu circuitele cu porți NOR Orez zăvor NOR în starea (a); zăvor NOR în starea (b); tabel de adevăr pentru funcția NOR (c) Schema prezentată în fig , a, se numește zăvor SR Are două intrări: (Setare - instalare) și R (Resetare - resetare) Are, de asemenea, două ieșiri complementare, Q și Q Spre deosebire de circuitul combinatoriu, ieșirile latch nu sunt determinate de intrările de curent Pentru a înțelege cum funcționează zăvorul, să presupunem că = și R = (în general, semnalul la aceste intrări este de cele mai multe ori) Să presupunem, de asemenea, că Q = Deoarece Q este returnat la poarta NOR de sus și ambele intrări la această poartă sunt , atunci ieșirea sa, Q, este Una este returnată la poarta de jos, care se termină cu o intrare , celălalt este , iar rezultatul este Q = O astfel de stare este cel puțin consecventă din punct de vedere logic (vezi Fig , a) Acum să ne imaginăm că Q = și R și sunt încă Poarta de sus are intrări și și o ieșire Q (adică ) care merge înapoi la poarta de jos O astfel de stare, prezentată în fig , b, este de asemenea consecvent din punct de vedere logic Situația în care ambele ieșiri sunt nu este consecventă din punct de vedere logic, deoarece în acest caz ambele porți ar avea două zerouri la intrare, ceea ce ar duce la unul la ieșire, nu la zero În mod similar, este imposibil să avem ambele ieșiri egale cu , deoarece asta ar avea ca rezultat intrări de și , ceea ce face ca ieșirea să fie și nu Derivarea noastră este simplă: la R = = , zăvorul are două stări stabile, pe care le vom numi și în funcție de Q, Acum să luăm în considerare efectul semnalelor de intrare asupra stării latch-ului Să presupunem că ia valoarea în timp ce Q = Atunci intrările superioare ale porții sunt și , ceea ce duce la semnalul de ieșire Y este Această modificare face ca ambele intrări către poarta de jos să fie egale cu și, în consecință, ieșirea este Astfel, setarea la nu transformă starea de la la Setarea R la când zăvorul este -'ініі și în starea , nu provoacă nicio modificare, deoarece ieșirea porții inferioare III OR este atât pentru intrările cât și pentru intrările AND Folosind un raționament similar, este ușor de observat că setarea S la I atunci când starea de blocare este (adică când Q = ) nu provoacă nicio modificare, iar setarea R la determină schimbarea stării de blocare Astfel, dacă este , atunci Q este , indiferent de starea anterioară a zăvorului În mod similar, schimbarea lui R la determină Q - Circuitul "își amintește" dacă ultimul semnal a fost S sau R Folosind proprietatea ♦ io, putem construi memoria computerului Încuietori SR sincron Poate fi mai convenabil ca starea zăvorului să se schimbe doar în momentele definitive/inițiale Pentru a atinge acest obiectiv, vom schimba ușor circuitul principal pentru a obține un latch SR sincron (Figura ) generator de ceas Orez Încuietoare SR sincronă Circuitul are o intrare suplimentară de ceas, care este în mare parte Dacă această intrare este , atunci ambele ieșiri ale porților AND sunt și, indiferent de valorile și R, zăvorul nu își schimbă starea Când valoarea intrării ceasului este , porțile AND sunt dezactivate și starea de blocare devine dependentă de și R Termenii turn-on și gating sunt adesea folosiți pentru a desemna faptul că intrarea ceasului este Până acum, nu ne-am dat seama ce se întâmplă când = R = Și din motive evidente: când atât R, cât și revin în cele din urmă la , circuitul devine idiosincratic Singura stare acceptabilă pentru S = R = \ este (JQ - , dar de îndată ce ambele intrări revin la , zăvorul trebuie să treacă la una dintre cele două stări stabile Dacă una dintre intrări este setată la , aceasta este diferit de celălalt, care rămâne la "câștigă", deoarece este singura intrare care controlează starea latch-ului Dacă ambele intrări merg la în același timp (ceea ce este foarte puțin probabil), latch-ul alege aleatoriu una dintre ele stări stabile Încuietori D sincron Pentru a rezolva situația cu incertitudinea SR-latch (incertitudinea se stinge dacă S = R = ), este necesar să se prevină apariția acesteia eu ia fig prezintă un circuit de blocare cu o singură intrare I) Deoarece intrarea către poarta AND inferioară este întotdeauna codul invers al intrării către poarta AND superioară, situația în care ambele intrări sunt nu apare niciodată Când D = și intrarea ceasului este , blocarea trece în starea Q = Când D = și intrarea ceasului este , blocarea trece în starea Q = Cu alte cuvinte, când intrarea ceasului este , valoarea curentă a lui D este eșantionată și stocată într-un dispozitiv de blocare Acest circuit, numit D-latch sincron, este o memorie pe un bit Valoarea stocată este întotdeauna disponibilă la ieșirea Q Pentru a încărca valoarea curentă (t) în memorie, trebuie aplicat un impuls pozitiv liniei de semnal de ceas Orez Încuietoare D sincronă Un astfel de circuit necesită tranzistori AND Circuitele mai complexe (cele care sunt utilizate în mod obișnuit în practică) pot stoca un bit pe doar tranzistoare Circuitul rămâne într-o stare staționară atâta timp cât i se aplică putere (nu este indicat în figură) Mai târziu ne vom uita la circuitele care uită rapid starea în care se află - au nevoie de "mementouri" constante pentru a preveni acest lucru declanșatoare Multe circuite, dacă este necesar, selectează o valoare pe o anumită linie la un moment dat în timp și o amintesc Într-un astfel de circuit, numit flip-flop, tranziția de stare nu are loc atunci când semnalul de ceas este , ci atunci când semnalul de ceas trece de la la (în creștere) sau de la la (în scădere) Prin urmare, lungimea pulsului de ceas nu contează, deoarece tranzițiile sunt rapide Să subliniem încă o dată diferența dintre un flip-flop și un zăvor Declanșatorul este declanșat de margine, iar zăvorul este declanșat de nivel Rețineți că acești termeni sunt adesea confuzi în literatură Mulți autori folosesc termenul "flip-flop" atunci când se referă la un zăvor și invers Există mai multe abordări pentru proiectarea declanșatorilor De exemplu, dacă există o modalitate de a genera un impuls foarte scurt pe marginea semnalului de ceas, acest impuls ar putea fi aplicat la D-latch În literatura internă, termenul "latch" (latch) nu este folosit deloc, se vorbește despre declanșatoare Cu toate acestea, aceasta introduce conceptul de declanșare T, care este declanșatorul "adevărat" - Notă științific ed În realitate, o astfel de metodă există Circuitul corespunzător este prezentat în Fig , a Timp ►- b Rio Generator de impulsuri (a); diagramă de timp pentru patru puncte din diagrama (b) La prima vedere, poate părea că ieșirea porții AND va fi întotdeauna n-'ieiiii, deoarece funcția AND din orice semnal cu inversarea lui dă , dar în realitate situația este ceva mai complicată Când semnalul trece prin banda AI, există o întârziere mică, dar nu zero Această schemă funcționează tocmai din cauza acestei întârzieri Să presupunem că măsurăm tensiunea în patru puncte a, b, c și d Semnalul de intrare în punctul a este impulsul ceasului principal (graficul inferior din Figura b) Semnalul din punctul b este afișat deasupra acestuia Rețineți că acest semnal este inversat și este furnizat cu o oarecare întârziere Timpul de întârziere depinde de tipul de invertor și este de obicei de câteva nanosecunde Semnalul din punctul c este de asemenea întârziat, dar această întârziere se datorează numai timpului de tranzit al semnalului (la viteza luminii) Dacă distanța fizică dintre punctele a și c este, de exemplu, de de microni, atunci întârzierea de propagare a semnalului este de , ns, ceea ce, desigur, este neglijabil în comparație cu timpul necesar semnalului pentru a călători prin invertor Astfel, SC > SC a b c d Orez Încuietori D și șlapi D Registrele Există diverse configurații de declanșare Pe fig Figura arată cum sunt combinate opt bistabile pentru a forma un registru de biți Registrul primește o valoare de intrare de biți (/() -І ) când semnalul de ceas CK se schimbă Toate liniile de ceas sunt conectate la un semnal de intrare al SC, astfel încât atunci când starea SC se schimbă, registrul primește o nouă valoare de date de biți de la magistrala de intrare Declanșatoarele în sine sunt de același tip ca în Fig , r, dar intrările inversoare sunt anulate de invertorul conectat • (Ah, deci flip-flops-urile sunt declanșate la o tranziție de la la Toate cele opt semnale ale njnggka sunt de asemenea combinate, dar când semnalul de resetare CLR ajunge la • nmpiiie , toți declanșatorii trec în starea Dacă nu înțelegeți de ce • Semnalul SC în sus și în jos este inversat la intrare și apoi inversat • Dacă la fiecare flip-flop, răspunsul este simplu: semnalul de intrare nu are suficientă putere pentru a declanșa toate cele opt flip-flop; invertorul de intrare în sine este folosit ca amplificator O Iq Oi C O l O O CK CLR O l O l O l O l Orez Registrul de biți construit din flip-flops cu un singur bit Registrul K-bit poate fi folosit ca element structural pentru a construi registre cu o capacitate mai mare De exemplu, un registru de de biți poate fi construit din două registre de biți prin tricotarea liniilor de ceas CK și a liniilor de resetare CLR Registrele și utilizările lor vor fi discutate mai detaliat în Capitolul Organizarea memoriei Deși am făcut trecerea de la o memorie simplă cu o capacitate de bit (vezi Fig ) la una pe K-biți (vezi Fig , b), construirea unei memorie de capacitate mare necesită un alt mod de organizare, în care puteți accesa cuvinte individuale Un exemplu de organizare a memoriei care satisface acest criteriu este prezentat în Fig Această memorie conține patru cuvinte de biți Fiecare operație citește sau scrie un întreg cuvânt de biți Deși cantitatea totală de memorie ( biți) nu este cu mult mai mare decât cea a unui flip-flop de biți, boombox-ul necesită mai puțini pini și, cel mai important, această organizare este aplicabilă pentru construirea de memorie mare Rețineți că numărul de cuvinte este întotdeauna o putere a lui Deși organizarea memoriei prezentată în Fig poate părea complicat la prima vedere, dar este de fapt foarte simplu datorită structurii sale regulate Microcircuitul conține linii de intrare, în special intrări pentru date - / (), C și / ; intrari pentru adrese - L () si At; intrări pentru control - CS (Chip Select - selectarea unui element de memorie), RD (RcaD - citire, acest semnal nu face distincție între citire și scriere) și OE (Output EpaYe - permisiunea de a emite semnale de ieșire), precum și linii de ieșire pentru date - O () și O , Date de intrare h* Scrie Poarta Exemplu de cuvânt linia Ai Ao Exemplu de cuvânt rândul Exemplu de cuvânt rândul CS RD OE CS•RD- Cuvântul Cuvântul Cuvântul Cuvântul DESPRE, O Rezoluție de ieșire = CS - RD • OE Orez Diagrama bloc logica pentru memorie x Fiecare rând reprezintă unul dintre cuvintele de biți Când citiți și scrieți, un cuvânt întreg este întotdeauna citit sau scris Interesant este că această memorie de biți necesită mai puțini pini decât registrul de biți din exemplul anterior Un flip-flop de biți necesită de pini (inclusiv putere și masă), în timp ce memoria de biți necesită doar deoarece, spre deosebire de un registru, cei biți de memorie partajează un semnal de ieșire Starea de intrare a adresei determină căror patru biți de memorie au voie să introducă sau să iasă o valoare Pentru a selecta acest bloc de memorie, logica externă trebuie să seteze semnalul CS la și, de asemenea, să seteze semnalul RD la pentru citire și pentru scriere Cele două linii de adresă trebuie să indice care dintre cele patru cuvinte de biți urmează să fie citit sau scris La citire, liniile de intrare pentru date nu sunt utilizate ііп'іі' іuіotsya, iar cuvântul selectat va fi trimis la liniile de ieșire a datelor Cu o nișă, biții găsiți pe liniile de intrare de date sunt încărcați în cuvântul de memorie de intrare; liniile de ieșire nu sunt utilizate Acum să vedem cum memoria prezentată în Fig 'Igiyre gate Și pentru alegerea cuvintelor din partea stângă a circuitului formează un decodor Alte invertoare sunt amplasate astfel încât fiecare poartă să fie pornită de o anumită adresă Fiecare poartă conduce o linie de selecție a cuvântului (pentru i ion , , și ) Când cipul este pe cale să scrie, șuieratul vertical CS-RD este setat la , activând una dintre cele patru porți de scriere cuvinte, încarcând intrarea în declanșatoarele pentru acel cuvânt O scriere se face numai dacă semnalul CS este și RD este , în timp ce se scrie doar cuvântul selectat de adresele A () și A (; cuvintele rămase nu se modifică Procesul de citire este similar cu coprocesul de scriere Decodificarea adreselor are loc exact în același mod ca atunci când scrieți Dar, în acest caz, linia CS-RD este setată la , astfel încât toate porțile de scriere sunt dezactivate și niciunul dintre riggeri nu este schimbat În schimb, linia de selectare a cuvântului declanșează porțile AND asociate cu biții Q ai cuvântului selectat Astfel, cuvântul selectat își alimentează datele la porțile SAU cu intrări situate în partea de jos a circuitului i, iar cele trei cuvinte rămase ies Prin urmare, ieșirea porților SAU este identică cu valoarea stocată în acest cuvânt Celelalte trei cuvinte nu au niciun efect asupra rezultatului Am putea proiecta un circuit în care trei porți SAU să fie conectate prin trei linii de ieșire, dar acest lucru ar cauza unele probleme Am tratat liniile de intrare a datelor și liniile de ieșire a datelor ca linii diferite În practică, se folosesc aceleași linii Dacă am conecta porțile SAU la liniile de ieșire a datelor, cipul ar încerca să scoată date (adică să seteze fiecare linie la o anumită valoare) chiar și în timpul procesului de scriere, interferând cu intrarea normală a datelor Din acest motiv, este de dorit să conectați cumva porțile SAU la liniile de ieșire a datelor atunci când citiți și să le deconectați complet când scrieți Tot ce avem nevoie este un comutator electronic care se poate conecta și deconecta într-o fracțiune de nanosecundă Din fericire, astfel de comutatoare există Pe fig , a prezintă o imagine simbolică a așa-numitului element tampon fără inversare Are o linie de intrare a datelor, o linie de ieșire a datelor și o linie de intrare de control Când intrarea de control este , elementul tampon acţionează ca un conductor (Fig b) Când intrarea de control este , elementul tampon acționează ca un izolator (Figura c), ca și cum cineva ar tăia ieșirea de date din restul circuitului cu tăietori de sârmă Conexiunea poate fi restabilită în câteva nanosecunde setând semnalul de control la Pe fig Figura d prezintă un element tampon inversat care acționează ca un invertor normal când semnalul de control este și separă ieșirea de restul circuitului când semnalul de control este Ambele elemente tampon sunt dispozitive cu trei stări, deoarece pot ieși zero un semnal, un singur semnal sau niciun semnal (caz cu circuit deschis) Elementele tampon îmbunătățesc, de asemenea Intrare Sfârșit de săptămână date date Control A b V Orez Element tampon fără inversare (a); reprezentarea elementului tampon fără inversare când semnalul de control este (b); reprezentarea elementului tampon fără inversare când semnalul de control este (a); element tampon cu inversare (r) semnale, astfel încât să poată gestiona mai multe semnale în același timp Uneori sunt folosite în circuite tocmai ca amplificatoare, în timp ce capacitatea lor de comutare nu este folosită Până acum, ar trebui să vă fie clar de ce aveți nevoie de trei elemente tampon fără inversare pe liniile de ieșire a datelor Când semnalele , RD și OE sunt , semnalul de activare a ieșirii este, de asemenea, , ca urmare, elementele tampon sunt declanșate și un cuvânt este plasat pe liniile de ieșire Când unul dintre semnalele CS, RD și OE este , ieșirile sunt deconectate de la restul circuitului Cip-uri de memorie Avantajul memoriei prezentate în Fig este că o astfel de structură este aplicabilă în dezvoltarea memoriei mari Figura prezintă un circuit x (pentru cuvinte a câte biți fiecare) Pentru a-l extinde la x , trebuie să adăugați încă coloane de declanșare cu câte declanșatori fiecare, precum și linii de intrare și de ieșire Pentru a trece de la o schemă x la o schemă x , trebuie să adăugați încă patru rânduri de declanșatori, câte trei declanșatori fiecare, precum și o linie de adresă L , Cu această structură, numărul de cuvinte din memorie trebuie să fie o putere de doi pentru o eficiență maximă, iar numărul de biți dintr-un cuvânt poate fi orice Tehnologia de fabricație a circuitelor integrate se potrivește perfect cu structura obișnuită a cipurilor de memorie Pe măsură ce tehnologia avansează, numărul de biți care se pot potrivi pe un singur cip crește constant, dublându-se de obicei la fiecare luni (Legea lui Moore) Odată cu apariția cipurilor mari, cipurile mici sunt întotdeauna învechite, deoarece există întotdeauna un compromis între capacitate, viteză, putere, preț și ușurința de interfață De obicei, cele mai mari cipuri moderne sunt la mare căutare și, prin urmare, costă mai mult pe bit decât cipurile mici Cu orice cantitate de memorie, există mai multe opțiuni pentru organizarea microcircuitului Pe fig Figura prezintă două structuri posibile pentru un cip de Mbiți: K x și K x (dimensiunile cipului de memorie sunt de obicei date în biți, nu în octeți, așa că vom respecta această convenție aici) Pe fig , puteți vedea linii de adresă pentru accesarea unuia dintre cei de octeți și linii de date pentru încărcarea sau stocarea octetului selectat a b Orez Două moduri de organizare a memoriei de Mb ("O mică notă despre terminologie Pe unii pini, o tensiune scăzută provoacă o anumită acțiune, pe altele rămâne o tensiune scăzută Pentru a evita confuzia, vom folosi termenul set-and-signal atunci când o anumită acțiune este numită, în loc de a spune: "tensiunea crește sau scade Astfel, pentru unii pini Vi, valoarea semnalului înseamnă setarea unuia, pentru alții înseamnă setarea zero unitate, semnalul CS este Termenul opus este resetat Să revenim acum la microcircuitul nostru Deoarece un computer conține de obicei multe cipuri de memorie, este necesar un semnal pentru a selecta cip-ul necesar, astfel încât cipul de care avem nevoie să răspundă la apel și restul nu Semnalul CS (Chip Select) este utilizat în acest scop Op este setat să pornească cipul Pe lângă ok>, aveți nevoie de o modalitate de a face distincția între citiri și scrieri Semnalul WE (Write Written - write permission) indică faptul că datele trebuie scrise și nu citite În cele din urmă, semnalul OE (Output EnaYe - rezoluție de ieșire) este setat să emită semnale de ieșire Când acest semnal nu este prezent, ieșirea este deconectată de la restul circuitului eu ia fig , b folosește o schemă de adresare diferită Cipul este o matrice de x celule de un bit, care este de Mbit Pentru a accesa un cip, trebuie mai întâi să selectați un rând Pentru іtogo pomer pe biți, această linie este alimentată la pinii de adresă Apoi este setat semnalul RAS (Row Address Strobe) După aceea, numărul coloanei este aplicat pinilor de adresă și este setat semnalul C AS (Column Address Strobe) Microcircuitul răspunde la g și a condus prin primirea sau furnizarea unui bit de date Cipurile de memorie mari sunt adesea fabricate ca matrice m x n care sunt accesate rând și coloană Această organizare a memoriei reduce numărul de pini necesari, dar, pe de altă parte, încetinește accesul la microcircuit, deoarece sunt necesare două cicluri de adresare: unul pentru rând, celălalt pentru coloană Pierderea de viteză este parțial compensată de faptul că în unele microcircuite este posibilă transmiterea unei adrese de rând și apoi transmiterea mai multor adrese de coloană pentru a accesa biții seriali ai rândului Cu mulți ani în urmă, cele mai mari cipuri de memorie erau de obicei aranjate așa cum se arată în Fig b Deoarece dimensiunea cuvântului a crescut de la la de biți și mai mult, a devenit incomod să folosiți astfel de microcircuite Pentru a construi memorie cu cuvinte de de biți din microcircuite de K x , sunt necesare de microcircuite, care funcționează în paralel Aceste de cipuri au o capacitate totală de cel puțin MB Dacă utilizați K x cipuri, veți avea nevoie de doar cipuri, dar memoria va fi de MB Pentru a nu se încurca cu de cipuri, majoritatea producătorilor produc familii de cipuri cu lungimi de cuvinte de , și biți Situația cu cuvintele pe de biți este, desigur, și mai rea Exemple de cipuri moderne cu o capacitate de Mbit sunt prezentate în fig Fiecare astfel de cip conține patru bănci de memorie internă de Mbit fiecare; în consecință, sunt necesare două linii de selecție a băncii pentru a defini o bancă Pe un microcircuit de M x , prezentat în fig , a, sunt alocate linii pentru semnalele RAS, pentru semnalele CAS și linii pentru selecția băncii Luate în ansamblu, de semnale oferă capacitatea de a adresa de celule interne de biți Pe un microcircuit de M x , prezentat în fig , , linii sunt alocate pentru semnalele RAS, linii pentru CAS și linii pentru selecția băncii SA A A AZ A A A A A A A A A Cip de memorie Mx ( Mbit) D RAS CAS Banca Banca *-D CS WE OE b A Orez Două moduri de a organiza un cip de memorie de Mbit J 'pini Astfel, de semnale fac posibilă adresarea oricăreia dintre celulele interne de biți Numărul de rânduri și coloane din jetoane este ajustat pe baza factorilor de inginerie Matricea nu trebuie să fie "Sud" pentru a fi pătrată Aceste exemple demonstrează în mod clar importanța a două aspecte neînrudite ale designului cipului de memorie Primul se referă la lățimea ieșirii (în biți) - cu alte cuvinte, numărul de biți ( , , , etc ) din semnalul de ieșire Al doilea aspect este modul în care sunt reprezentați biții de adresă; Există două opțiuni aici: în primul rând, biții de adresă pot fi prezentați simultan pe diferiți pini și, în al doilea rând, poate exista o reprezentare secvențială a rândurilor și coloanelor - așa cum se arată în Fig Înainte de a trece la proiectarea microcircuitului, specialistul trebuie să decidă asupra ambelor aspecte RAM și ROM Ih g tipuri de memorie, pe care le-am considerat până acum, au un lucru în comun - vіiiiietvo: vă permit să scrieți și să citiți informații O astfel de memorie se numește RAM (memorie cu acces aleatoriu) sau RAM (memorie aleatorie ai ci - memorie cu acces aleatoriu) Există două tipuri de RAM: statică și dinamică RAM statică (SRAM) este construită folosind D-flip-flops Informațiile din RAM sunt stocate atâta timp cât sunt alimentate: secunde, minute, ore și chiar dynes RAM statică este foarte rapidă De obicei, timpul de acces este de câteva nanosecunde Din acest motiv, RAM statică este adesea folosită ca cache de nivel al doilea În RAM dinamică (Dynamic RAM, DRAM), dimpotrivă, declanșatoarele nu sunt utilizate DRAM este o serie de celule, fiecare conținând un tranzistor și un mic condensator Condensatorii pot fi contaminați și epuizați, permițând depozitarea gloanțelor și unităților Deoarece sarcina electrică tinde să dispară, fiecare bit din DRAM trebuie actualizat (reîncărcat) la fiecare câteva milisecunde pentru a preveni scurgerea datelor Deoarece logica externă trebuie să se ocupe de actualizare, DRAM necesită o interfață mai complexă decât DRAM-ul japoneză, deși acest dezavantaj este compensat de volumul mare Deoarece DRAM are nevoie doar de un tranzistor și un condensator pe bit (RAM statică are nevoie de tranzistori pe bit în cel mai bun caz), DRAM are o densitate de scriere foarte mare (mulți biți pe cip) Din acest motiv, memoria principală se bazează aproape întotdeauna pe RAM dinamică, dar RAM dinamică este foarte lentă (timpul de acces durează zeci de nanosecunde) Astfel, combinația dintre cache-ul bazat pe SRAM și memoria principală bazată pe DRAM combină avantajele ambelor dispozitive Există mai multe tipuri de RAM dinamică Cel mai vechi tip încă utilizat este FPM (Fast Page Mode) Această memorie RAM este o matrice de biți Hardware-ul reprezintă adresa rândului și apoi adresele coloanelor (am descris acest lucru proces, când vorbim despre dispozitivul de memorie prezentat în fig b) Datorită fenomenului semnalelor transmise, memoria funcționează asincron în raport cu generatorul principal de ceas al sistemului FPM este înlocuit treptat de memoria EDO (Extended Data Output) , care permite accesarea memoriei înainte ca accesul anterior să se încheie Acest mod pipeline, deși nu accelerează accesul la memorie, îmbunătățește debitul permițând mai multe cuvinte pe secundă Memoriile precum FPM și EDO au rămas relevante în acele zile când timpul de ciclu al cipurilor de memorie nu depășea ns Ulterior, odată cu creșterea vitezei procesoarelor, s-a format nevoia de cipuri de memorie mai rapide, iar apoi modurile asincrone FPM și EDO au fost înlocuite cu RAM dinamică sincronă (Synchronous DRAM, SDRAM) RAM dinamică sincronă este controlată de la ceasul sistemului principal Acest dispozitiv este un hibrid de memorie RAM statică și dinamică Principalul avantaj al RAM dinamică sincronă este că elimină dependența cipului de memorie de semnalele de control CPU-ul spune memoriei câte cicluri să ruleze și apoi îl rulează Fiecare ciclu emite , sau biți, în funcție de numărul de linii de ieșire Eliminarea dependenței de semnalele de control duce la un transfer mai rapid de date între CPU și memorie Următorul pas în evoluția SDRAM a fost memoria DDR (Double Data Rate) Această tehnologie oferă date de ieșire atât în față, cât și la scăderea pulsului, drept urmare rata de transfer este dublată De exemplu, un cip de biți de acest tip, care rulează la MHz, emite două valori de biți de de milioane de ori pe secundă (desigur, această viteză este menținută pentru o perioadă scurtă de timp); astfel, teoretic, viteza pe termen scurt poate ajunge la , GB/s Interfețele de memorie DDR și DDR oferă o creștere suplimentară a performanței față de DDR prin creșterea vitezei magistralei de memorie la MHz, respectiv MHz La momentul publicării cărții, cele mai rapide cipuri DDR puteau scoate date la o viteză de GB/s Memorie non volatila RAM nu este singurul tip de cipuri de memorie În multe cazuri, datele trebuie păstrate chiar și atunci când alimentarea este oprită (de exemplu, când vine vorba de jucării, diverse dispozitive și mașini) Mai mult, după instalare, nici programul, nici datele nu trebuie modificate Aceste cerințe au condus la apariția ROM (memorie doar în citire) sau ROM (Memorie numai în citire - memorie doar în citire) ROM-urile nu permit modificarea și ștergerea informațiilor stocate în ele (nici intenționat, nici accidental) Datele sunt scrise pe ROM în timpul producției Pentru a face acest lucru, se face un șablon cu un anumit set de biți, care este suprapus pe un fotosensibil Memoria dinamică de tip EDO a înlocuit practic memoria dinamică convențională care funcționează în modul FPM la mijlocul anilor nouăzeci - Notă științific ed mmigial, iar apoi părțile deschise (sau închise) ale suprafeței sunt gravate Cel mai simplu mod de a schimba programul în ROM este schimbarea întregului cip ROM-urile sunt mult mai ieftine decât RAM dacă sunt comandate în vrac pentru a plăti costul realizării unui șablon Cu toate acestea, nu permit imgpenia după lansare și poate dura câteva săptămâni între comandarea unui ROM și lansarea Pentru a facilita companiilor să dezvolte noi dispozitive bazate pe ROM, au fost lansate ROM-uri programabile (PROM) Spre deosebire de ROM-urile convenționale, nm poate fi programat pe teren pentru a reduce timpii de livrare Multe ROM-uri programabile conțin o serie de legături fuzibile mici Pentru a arde un anumit jumper, trebuie să selectați rândul și coloana necesare, apoi aplicați o tensiune înaltă unui anumit pin al microcircuitului ("Următoarea dezvoltare a acestei linii este un ROM programabil șters (l insable PROM, EPROM), care nu poate fi programat numai în operare de la distanță, ci și șterge informațiile din acesta Dacă fereastra de cuarț și acest ROM sunt expuse la lumina ultravioletă în decurs de minute, toți biții vor fi setați la Dacă sunt multe modificări de făcut, dar timpul unui singur pas de proiectare, ROM-urile care se pot șterge sunt mult mai economice decât ROM-urile obișnuite, deoarece pot fi utilizate în mod repetat , microcircuitul C are o structură care este prezentată în Fig , a, iar o astfel de structură este tipică pentru RAM statică Este interesant că astfel de microcircuite "vechi" nu se sting Ele devin mai ieftine și sunt utilizate în produse de buget , Deocamdată, microcircuitele unice C pot fi cumpărate cu mai puțin de USD, iar cu o cantitate mare de medicamente vor costa mult mai puțin Următoarea etapă este un ROM reprogramabil electronic (Electronic I PROM, EEPROM), care nu trebuie să fie plasat într-o cameră specială pentru ca acesta să fie expus la razele ultraviolete - pentru a șterge informația, este suficient să trimiteți impulsurile corespunzătoare De asemenea, pentru a reprograma acest dispozitiv, nu este nevoie să fie conectat la un dispozitiv de programare special, spre deosebire de un ROM programabil șters În același timp, cele mai mari EPROM-uri și (de ori mai mici decât ROM-urile șterse convenționale și funcționează de două ori mai lent NEPROM-urile nu pot concura cu RAM-urile dinamice-i și statice, deoarece funcționează de ori mai lent, capacitatea lor și r;іz) mai puțin și costă mult mai mult Sunt utilizate numai în acele sisteme când este necesar să se salveze informații atunci când alimentarea este oprită Un tip mai modern de ROM reprogramabil electronic este memoria flash Spre deosebire de Erasable ROM, care este ștearsă prin expunerea la razele ultraviolete, și EEPROM, care este octet cu octet, memoria flash este ștearsă și scrisă în blocuri Mulți furnizori produc plăci de circuite mici care conțin până la GB de memorie Sunt folosite pentru a stoca imagini în camere digitale și în alte scopuri După cum sa discutat în capitolul , flash-ul începe încet să înlocuiască discurile, ceea ce reprezintă un pas uriaș înainte, având în vedere timpul acces in ns Memoria flash oferă timpi de acces mai buni cu un consum mai mic de energie; pe de altă parte, costul unui bit de memorie flash este semnificativ mai mare decât cel al discurilor O scurtă descriere a diferitelor tipuri de memorie este dată în tabel Tabelul Caracteristicile diferitelor tipuri de memorie Tip dispozitiv de stocare Categorie Șterge informații Schimbați informații în funcție de octeți Necesar de alimentare Aplicație SRAM Citire/Scriere Electrică Da Da L Cache DRAM Citire/Scriere Electrică Da Da Memorie principală (vechită) SDRAM Citire/Scriere Electrică Da Da Memorie principală (modele noi) ROM Numai citire Imposibil Nu Nu Dispozitive masive PROM Numai citire Nu este posibil Nu Nu Dispozitive de volum mic EPROM Lumină UV predominant lizibilă Nu Nu Prototiparea dispozitivului EEPROM Citite predominant Electrice Da Nu Prototiparea dispozitivului Memorie flash Citire și scriere Electrică Nu Nu Camere digitale FPGA După cum sa menționat în Capitolul , Field Programmable Gate Arrays (FPGA) sunt cipuri logice programabile - prin încărcarea datelor de configurare corespunzătoare în FPGA, puteți crea un circuit logic arbitrar Principalul avantaj al FPGA este capacitatea de a construi noi circuite hardware în câteva ore (în loc de luni petrecute pe producția de cipuri) Cu toate acestea, circuitele integrate nu vor deveni un lucru din trecut - costul lor în loturi mari este semnificativ mai mic decât cel al FPGA-urilor, funcționează mai rapid și consumă mai puțină energie Cu toate acestea, FPGA-urile, datorită avantajelor lor în faza de proiectare, sunt adesea folosite în prototiparea dispozitivelor și în producția de serie mică Să aruncăm o privire mai atentă la FPGA-uri și să vedem cum sunt utilizate pentru a implementa o gamă largă de circuite logice Cipul FPGA este format din două componente principale care se repetă de multe ori în arhitectura sa: tabele de căutare LUT (LookUp Table) și legături programabile ILGG (Fig a) este un bloc mic de Ііnmіpi programabile, care produce un semnal transmis către registru (opțional) și • ііem și comunicare programabilă Se folosește memoria programabilă pentru • imdіpіiya funcție logică arbitrară LUT din figură are memorie - , care este capabilă să emuleze orice circuit logic cu patru "iod" și patru biți de ieșire Pentru a programa LUT-ul în memorie, sunt folosite răspunsurile logicii combinatorii emulate Cu alte cuvinte, dacă logica combinatorie pentru intrarea X produce valoarea Y, atunci aceasta din urmă este scrisă și , GY cu indicele X Un exemplu din fig b arată cum implementează un singur LUT pe biți ;| contor de biți cu resetare Contorul de la valoarea dată adaugă la valoarea sa curentă (adăugare modulo ) până când ajunge • w pal reset CLR; în acest caz, contorul este resetat la În implementarea contorului din acest exemplu, primele patru elemente ale LUT au fost umplute cu gloanțe Ele oferă o ieșire atunci când contorul este resetat Astfel, primul bit LUT (Y) reprezintă semnalul de intrare resetat (CLR) Pentru restul LUT-urilor, valoarea cu indice / conține rezultatul operației (/ + ) modulo Pentru a finaliza acest circuit, semnalul de ieșire O trebuie conectat printr-o legătură programabilă la semnalul intern de intrare /() Conformitatea semnalului Contor FPGA •z CLR (r) ^ SC SC Date Adr treizeci Date Adr Orez tabel de conversie FPGA (a); Configurație LUT pentru a crea un contor de biți cu resetare (b) Pentru a înțelege mai bine resetarea contorului FPGA, să vedem cum funcționează Dacă, de exemplu, starea curentă a contorului este , iar semnalul de resetare (CLR) nu este setat, atunci adresa de intrare LUT va fi egală cu , ceea ce va duce la ieșire și la Dacă semnalul de resetare (CLR) este setat în această stare, apoi intrarea LUT-ul va primi , rezultând că următoarea stare este Una peste alta, pare a fi doar o modalitate inteligentă de a crea un contor cu o resetare De fapt, un circuit cu un circuit de creștere și un semnal i-throw pe bistabile va fi mai compact, mai rapid și va consuma mai puțină energie Principalul avantaj al unui circuit bazat pe FPGA este că poate fi construit într-o oră acasă, în timp ce un circuit personalizat mai eficient ar trebui realizat din siliciu, ceea ce ar dura o lună sau mai mult Pentru a utiliza FPGA, trebuie să scrieți o descriere a circuitului sau a unui program într-un limbaj de descriere hardware (un limbaj de programare folosit pentru a descrie structurile hardware) Descrierea este procesată de un sintetizator care asociază circuitul cu o arhitectură FPGA specifică Una dintre problemele cu utilizarea FPGA-urilor este că nevoile unui anumit circuit depășesc adesea capacitățile unui FPGA FPGA-urile sunt fabricate cu un număr variabil de LUT-uri, cu o creștere a numărului acestora din urmă ducând la o creștere a costului De regulă, dacă rezultatul nu se încadrează în cerințe, fie trebuie să simplificați circuitul, fie să renunțați la o parte din funcționalitate, fie să cumpărați o matrice FPGA mai mare (și mai scumpă) Circuitele foarte mari pot depăși capacitățile chiar și ale celor mai mari FPGA-uri, caz în care proiectantul trebuie să combine mai multe FPGA-uri în circuit; sarcina devine cu siguranță mai complicată, dar rămâne totuși mult mai ușor să proiectați un circuit integrat specializat cu drepturi depline Chip-uri și magistrale de procesor Înarmați cu informații despre microcipuri, generatoare de ceas și cipuri de memorie, putem aduna toate piesele și începem să studiem sisteme întregi În această secțiune, ne uităm mai întâi la procesoarele la nivel logic digital, inclusiv la pinouts (adică la semnificația semnalelor de pe diferiții pini) Deoarece procesoarele sunt strâns legate de magistralele pe care le folosesc, vom sublinia, de asemenea, pe scurt principiile de bază ale proiectării magistralelor Următoarele secțiuni oferă exemple detaliate de procesoare, vârful lor și interacțiunile dintre ele Chip-uri de procesor Toate procesoarele moderne se potrivesc pe un singur cip, ceea ce face ca interacțiunile lor cu restul sistemului să fie bine definite Fiecare cip de procesor conține un set de pini prin care se face schimb de informații cu lumea exterioară Unii pini transmit semnale de la CPU, alții primesc semnale de la alte componente, iar alții fac ambele Examinând funcțiile tuturor pinii, putem afla cum interacționează procesorul cu dispozitivele de memorie și I/O la nivel logic digital Concluziile microcircuitului procesorului central pot fi împărțite în trei tipuri: adresă, informații și control Acești pini sunt conectați la pinii corespunzători de pe cipurile de memorie și cipurile dispozitivului I/O printr-un set de fire paralele (numite magistrală) Pentru a apela o comandă, CPU trimite mai întâi adresa acelei comenzi în memorie pe pinii adresei Apoi activează una sau mai multe linii de control pentru a spune memoriei de ce are nevoie (de exemplu, pentru a citi un cuvânt) Memoria răspunde plasând cuvântul necesar pe pinii de date ai procesorului și semnalând că a fost făcut Când CPU primește acest semnal, citește cuvântul și execută instrucțiunea apelată Comanda poate necesita citirea sau scrierea cuvintelor care conțin date Și în acest caz, întregul proces se repetă pentru fiecare cuvânt suplimentar, dacă are loc procesul de citire și scriere, vom analiza în detaliu în continuare Deocamdată, trebuie să înțelegeți că procesorul comunică cu dispozitivele de memorie și I/O trimițând semnale către pini și primind semnale sau intrări Nu există altă modalitate de a face schimb de informații Numărul de pini de adresă și numărul de pini de informații sunt doi parametri cheie care determină performanța unui procesor Un microcircuit care conține t pini de adresă poate accesa (tm) celule de memorie De obicei, i este , sau Un cip cu n pini de informații poate citi sau scrie un cuvânt pe w biți într-o singură operație De obicei, u este , sau Un CPU cu pini de date va avea nevoie de operații pentru a citi un cuvânt de de biți, în timp ce un CPU cu de pini de date poate face aceeași treabă în operațiuni n/nicio Prin urmare, un cip cu de pini de informații este mult mai rapid, dar și mult mai scump Pe lângă ieșirile de adresă și informații, fiecare procesor conține ieșiri de control Acești pini vă permit să reglați și să sincronizați datele către și de la procesor și să efectuați alte funcții Toate procesoarele conțin pini pentru alimentare (de obicei + , V sau + , V), masă și ceas (pătrat) Restul pinii variază de la procesor la procesor Cu toate acestea, concluziile de control pot fi împărțite în mai multe categorii principale: + management autobuz; eu intrerup; + arbitraj autobuz; + semnale coprocesor; + stare; + diverse În cele ce urmează, vom descrie pe scurt fiecare dintre aceste categorii, iar când ne uităm la cipurile Intel Core i , TI OMAP și Atmel ATmegal , vom oferi informații mai detaliate O schemă a unui CPU tipic care utilizează aceste tipuri de semnale este prezentată în Fig Pinii de control al magistralei sunt în cea mai mare parte ieșiri de la CPU către magistrală (și, prin urmare, intrări către cipurile de memorie și cipurile I/O) Acestea vă permit să indicați că procesorul dorește să citească informații din memorie sau să scrie informații în memorie sau să facă altceva Pinii de întrerupere sunt intrări de la dispozitivele I/O către procesor În majoritatea sistemelor, procesorul poate semnala unui dispozitiv I/O să înceapă o operație și apoi să facă altceva în timp ce dispozitivul I/O își face treaba Când dispozitivul I/O se termină, controlerul I/O trimite un semnal către unul dintre pinii de întrerupere pentru a întrerupe procesorul și a-l forța să întrețină dispozitivul I/O (de exemplu, verificați erorile I/O) Unele procesoare includ un pin pentru a confirma semnalul de întrerupere ilana a LOGICA digitala Adresarea Arbitraj autobuz Date Gestionarea autobuzelor Microprocesor tipic coprocesor Stat întreruperi Alte semnale Simbolul Pământului Putere de sincronizare cu cifre semnal Orez Pinout-ul unui procesor tipic Săgețile indică semnale de intrare și de ieșire, iar liniile diagonale scurte indică prezența mai multor ieșiri de acest tip Numărul acestor pini depinde de modelul procesorului Pinii de arbitraj de magistrală sunt necesari pentru a regla fluxul de informații pe magistrală, adică pentru a evita astfel de situații când două dispozitive încearcă să folosească magistrala în același timp În ceea ce privește arbitrajul, procesorul este considerat a fi doar unul dintre dispozitive Unele procesoare pot funcționa cu diferite co-procesoare (de exemplu, GPU-uri, procesoare în virgulă mobilă etc ) Pentru a asigura schimbul de informații între procesor și coprocesor, se folosesc pini speciali Pe lângă acești pini, unele procesoare au pini suplimentari Unele dintre ele emit sau primesc informații de stare, altele sunt necesare pentru a reporni computerul, iar altele sunt concepute pentru a asigura compatibilitatea cu cipurile dispozitivelor I/O mai vechi Anvelope pentru computer O magistrală este o serie de fire care conectează mai multe dispozitive Anvelopele pot fi clasificate în funcție de funcția lor Acestea pot fi interne procesorului și servesc la transferul de date către și de la ALU, sau pot fi externe procesorului și pot conecta procesorul la memorie sau la dispozitive I/O Fiecare tip de anvelopă are anumite proprietăți și fiecăruia dintre ele li se impun anumite cerințe În aceasta și în următoarele subsecțiuni, ne vom concentra asupra magistralelor care conectează CPU la memorie și dispozitivele I/O În capitolul următor, vom arunca o privire mai atentă asupra magistralelor interne ale procesorului Primele computere personale aveau o singură magistrală externă, numită magistrală de sistem Acesta a constat din mai multe fire de cupru (de la la ) care au fost încorporate în placa de bază Pe placa de bază, la distanțe egale unul de celălalt, existau conectori pentru cipuri de memorie și dispozitive de intrare-ieșire Calculatoarele personale moderne conțin de obicei o magistrală specială între unitatea centrală de procesare și memorie și extreme Merc este o altă magistrală pentru dispozitivele I/O Pe fig sistem imagine-mnim cu o magistrală de memorie și o magistrală I/O Cip de procesor Autobuz pe cip Orez Sistem informatic cu mai multe autobuze Anvelopele sunt de obicei descrise în literatură ca săgeți îndrăznețe, așa cum se arată până acum în această figură Există o mică diferență între o săgeată îngroșată și o săgeată fără aldine, cu o linie diagonală scurtă care indică numărul de biți Când tipul tuturor biților este același, de exemplu toți biții de adresă sau toți biții de date, este desenată o săgeată obișnuită Când liniile de adresă, repararea și datele și controlul sunt activate, se folosește o săgeată aldine În timp ce proiectanții de procesoare pot folosi orice tip de magistrală pentru un cip, trebuie aplicate reguli clare despre modul în care funcționează magistrala; și toate dispozitivele conectate la magistrală trebuie să respecte aceste reguli pentru ca plăcile fabricate de terți să se potrivească cu magistrala de sistem Aceste reguli se numesc protocol de magistrală În plus, trebuie să existe anumite cerințe tehnice pentru ca plăcile de la alți producători să se potrivească în șinele PCB și să aibă conectori care se potrivesc mecanic cu placa de bază, în ceea ce privește tensiunile, sincronizarea, etc Unele magistrale nu au specificații mecanice, deoarece sunt concepute pentru poate fi utilizat fie cu circuite integrate, de exemplu, pentru a interconecta componente pe sisteme cu un singur cip (SoC) Există o serie de autobuze utilizate pe scară largă în lumea computerelor, cum ar fi: Omnibus (PDP- ), Unibus (PDP- ), Multibus ( ), VME (echipament de laborator fizic), IBM PC (PC/XT), ISA (PC/AT), EISA ( ), Microchannel (PS/ ), Nubus (Macintosh), PCI (diverse computere personale), SCSI (diverse computere personale și stații de lucru), Universal Serial Bus (calculatoare personale moderne), FireWire (electronice de uz casnic) Poate că lucrurile ar fi mult mai ușor dacă toate cauciucurile, cu excepția uneia sau două, ar dispărea de pe suprafața pământului Din păcate, standardizarea în acest domeniu pare foarte puțin probabilă, deoarece toate aceste pietre prețioase incompatibile au fost deja investite prea mult Să începem cu cum funcționează vârfurile Unele dispozitive conectate la magistrală sunt active și pot iniția trimiterea de informații, în timp ce altele sunt pasive și așteaptă solicitări Dispozitivul activ se numește master, dispozitivul pasiv se numește slave Când CPU solicită controlerului de disc să citească sau să scrie un bloc de informații, CPU acționează ca master și controlerul de disc acționează ca slave Controlerul de disc poate acționa ca un master atunci când spune memoriei să accepte cuvintele pe care le-a citit de pe disc Câteva combinații tipice master și slave sunt enumerate în Tabelul , Memoria nu poate fi în niciun caz un dispozitiv principal Tabelul Exemple de maestru și sclav Dispozitiv master Dispozitiv slave Exemplu Memoria CPU Apelarea comenzilor și a datelor Dispozitiv I/O CPU Inițializează transferul de date Unitate centrală de procesare Coprocesor Trimiterea unei comenzi de la procesor la coprocesor Dispozitiv I/O Memorie DMA CPU coprocesor Coprocesorul apelează operanzi de la CPU Semnalele binare produse de dispozitivele computerizate adesea nu au suficientă putere pentru a activa magistrala, mai ales dacă este suficient de lungă și dacă la el sunt conectate multe dispozitive Din acest motiv, majoritatea șoferilor de autobuz sunt de obicei conectați la magistrală printr-un cip numit driver de autobuz, care este în esență un amplificator digital În mod similar, majoritatea dispozitivelor slave sunt conectate la magistrală printr-o chiuvetă de magistrală Pentru dispozitivele care pot fi atât master cât și slave, se folosește un transceiver magistrală sau transceiver Aceste cipuri, concepute pentru a interacționa cu autobuzul, sunt adesea dispozitive cu trei stări, oferindu-le posibilitatea de a se detașa atunci când nu sunt necesare Uneori, acestea sunt conectate printr-un colector deschis, ceea ce va da un efect similar Când unul sau mai multe dispozitive colectoare deschise solicită accesul la magistrală în același timp, rezultatul este o operație booleană OR pe toate aceste semnale Un astfel de acord se numește SAU de montaj Pe majoritatea autobuzelor, unele linii sunt dispozitive tri-state, iar altele care necesită o proprietate cu fir SAU sunt open-collector La fel ca și procesorul, vârful are linii de adresă, informații și control Cu toate acestea, este posibil să nu existe o corespondență unu-la-unu între pinii procesorului și semnalele magistralei De exemplu, unele procesoare au trei pini care oferă un semnal de citit sau de scris în memorie, de a citi dispozitivul de la I/O, de a scrie pe un dispozitiv de I/O sau de a efectua o altă operație O magistrală normală poate conține o linie pentru citirea din memorie, o a doua pentru scrierea în memorie, o a treia pentru cipuri și cipuri de procesor a ■ w ■I (' dispozitive de intrare-ieșire, al patrulea - pentru scrierea pe dispozitivul de intrare-■і etc Apoi procesorul ar trebui să fie conectat la o astfel de magistrală printr-un cip-■f poate conduce linii de magistrală Designul și principiile de funcționare ale anvelopelor sunt destul de complexe wonro-|| Au fost scrise o serie de cărți pe acest subiect [Anderson et al , ; Solari și Willse, Principalele probleme de proiectare sunt lățimea autobuzului, fonizarea autobuzului, arbitrarea autobuzului și performanța autobuzului Toate aceste na-Tstry afectează semnificativ debitul autobuzului În următoarele subsecțiuni, vom lua în considerare fiecare dintre ele ■Anvelope Irina ■Irina (numărul de linii de adresă) al magistralei este cel mai evident parametru la ■Activare Cu cât magistrala conține mai multe linii de adresă, cu atât mai multă memorie poate accesa procesorul Dacă magistrala conține n adrese ■VIY-uri, atunci procesorul o poate folosi pentru a accesa CI-uri de memorie diferite de inchi Memoria de mare capacitate necesită o mulțime de adrese ■NIU Totul pare a fi simplu Problema este că pentru anvelopele late este nevoie de mai mult pentru anvelopele înguste Ocupă mai mult spațiu fizic (de exemplu, pe o placă de bază) și necesită conectori mai mari Toți factorii III fac o anvelopă scumpă Prin urmare, trebuie făcut un compromis între cantitatea maximă de memorie disponibilă și costul sistemului Un sistem cu o magistrală care conține de linii de adresă și o memorie de de octeți va fi mai scump decât un sistem cu o magistrală care conține de linii de adresă și o astfel de memorie de de octeți Extinderea ulterioară nu este gratuită Mulți designeri de sisteme au fost miopi, cu consecințe nefericite Primul model de PC IBM conținea procesorul ȘI un vârf de adresă de de biți (Fig , a) Autobuzul a permis accesul la MB de memorie adresa pe de biți adresa pe de biți adresa pe de biți Control Control adresa pe biți Control adresa pe biți Adresă de management pe biți Control l Control V Orez Extinderea magistralei de adrese în timp Când a sosit următorul procesor ( ), Intel a decis să mărească spațiul de adrese la MB, așa că au trebuit adăugate încă linii (păstrând cele inițiale din motive de compatibilitate inversă), așa cum se arată în Figura b Din păcate, au trebuit adăugate și linii de control pentru noile linii de adresă Când a apărut procesorul , au fost adăugate încă linii de adresă și, desigur, mai multe linii de control, așa cum se arată în Fig , c Rezultatul este un autobuz EISA Cu toate acestea, arhitectura s-a dovedit a fi mult mai complicată decât dacă ar fi fost folosite de linii de la bun început În timp, nu doar numărul liniilor de adresă crește, ci și numărul liniilor de informații, deși acest lucru se întâmplă dintr-un motiv diferit Există două moduri de a crește lățimea de bandă a magistralei: reduceți timpul ciclului magistralei (efectuați mai multe transferuri pe secundă) sau măriți lățimea magistralei de date (adică creșteți numărul de biți transferați pe ciclu) Este posibil să creșteți viteza autobuzului, dar este destul de dificil să faceți acest lucru, deoarece semnalele pe diferite linii sunt transmise la viteze diferite (acest fenomen se numește declin de magistrală) Cu cât circula mai repede autobuzul, cu atât este mai mare declinarea Pe măsură ce viteza autobuzului crește, apare o altă problemă: în acest caz, acesta devine incompatibil cu versiunile anterioare Plăcile mai vechi concepute pentru autobuzul mai lent nu se pot descurca pe cel nou Această situație este dezavantajoasă pentru proprietarii și producătorii de plăci vechi Prin urmare, este obișnuit să adăugați pur și simplu linii noi pentru a crește productivitatea, așa cum se arată în Fig După cum vă puteți imagina, acest lucru are și dezavantajele sale IBM PC și succesorii săi, de exemplu, au început cu linii de date, apoi au trecut la , apoi de linii, toate pe aceeași magistrală Pentru a rezolva această problemă, dezvoltatorii preferă uneori magistrala multiplex În acest autobuz nu există o împărțire în linii de adresă și informații O plată poate avea, de exemplu, de linii atât pentru adrese, cât și pentru date Aceste linii sunt folosite mai întâi pentru adrese, apoi pentru date Pentru a scrie informații în memorie, trebuie mai întâi să transferați adresa în memorie, apoi datele În cazul liniilor separate, adresele și datele pot fi transmise împreună Îmbinarea liniilor reduce lățimea și costul autobuzului, dar sistemul este mai lent Prin urmare, designerii trebuie să cântărească argumentele pro și contra înainte de a face o alegere Timpul autobuzului Anvelopele pot fi împărțite în două categorii în funcție de momentul lor Autobuzul sincron conține o linie care este condusă de un oscilator cu cristal Semnalul pe această linie este o undă pătrată cu o frecvență de obicei de la la MHz Orice acțiune de magistrală necesită un număr întreg de așa-numitele cicluri de magistrală Magistrala asincronă nu conține un oscilator principal Ciclurile magistralei pot fi arbitrare și nu sunt neapărat aceleași pentru toate perechile de dispozitive În continuare, vom lua în considerare fiecare tip de anvelopă separat Ciclu de citire cu o singură perioadă de așteptare Timp A Valoarea Oimmol Unități minime maxime L Întârziere Adresă ns *m, Interval între stabilizarea adresei și setarea semnalului MREQ HC Intervalul dintre scăderea semnalului de ceas în ciclul T și setarea semnalului MREQ NS і", Intervalul dintre declinul semnalului de sincronizare în ciclul Tt și setarea semnalului RD NS Perioada de transmisie înainte de scăderea ceasului ns min Întârziere între scăderea semnalului de ceas în ciclul T și resetarea semnalului MREQ ns Intervalul dintre declinul semnalului de sincronizare în ciclul T și resetarea semnalului RD NS ІІІ Perioada de continuare a transmisiei de date din momentul resetarii semnalului RD ns b Orez Diagrama de timp a procesului de citire pe magistrala sincronă (a); anumite caracteristici temporale ale procesului de citire pe o magistrală sincronă (b) Anvelope sincrone Ca exemplu al modului în care funcționează o magistrală asincronă, luați în considerare diagrama de timp din Fig În acest exemplu, vom folosi un driver de MHz, care oferă un ciclu de magistrală de ns Deși poate părea că magistrala este lentă în comparație cu procesoarele de GHz și mai mari, nu multe autobuze moderne sunt mai rapide De exemplu, populara magistrală PCI a funcționat la MHz sau MHz, în timp ce magistrala PCI-X îmbunătățită (dar nu mai este utilizată) a funcționat la MHz Motivele vitezei reduse a anvelopelor moderne au fost deja discutate: ele includ probleme tehnice precum deformarea autobuzului și nevoia de compatibilitate În exemplul nostru, presupunem că citirea informațiilor din memorie durează ps din momentul în care adresa este setată După cum vom vedea în curând, este nevoie de trei cicluri de autobuz pentru a citi un cuvânt Primul ciclu începe în partea din față a segmentului Tr, iar al treilea ciclu se termină în partea din față a segmentului T , așa cum se arată în Fig Rețineți că niciuna dintre creșteri și căderi nu sunt desenate vertical, deoarece niciun semnal electric nu își poate schimba valoarea în timp zero În exemplul nostru, presupunem că este nevoie de ns pentru ca semnalul să se schimbe Generatorul și liniile de adresă și date, precum și liniile MREQ, RD, WAIT sunt afișate* pe aceeași scară de timp Începutul lui T este determinat de partea frontală a generatorului În timpul T, CPU plasează adresa cuvântului dorit pe liniile de adresă Deoarece o adresă nu este o singură valoare (spre deosebire de un generator), nu o putem afișa ca o singură linie în diagramă În schimb, am arătat-o ca două linii cu intersecții în care această adresă se schimbă Culoarea gri de pe diagramă arată că în acest moment nu contează ce valoare a primit semnalul Folosind aceeași convenție, vedem că conținutul liniilor de date este irelevant până la segmentul Tj După ce liniile de adresă au posibilitatea de a dobândi o nouă valoare, semnalele MREQ și RD sunt setate Primul indică faptul că se accesează memoria și nu dispozitivul I/O, iar al doilea indică faptul că citirea este în curs, nu scrierea Deoarece este nevoie de ns (parte a primului ciclu) pentru a citi informațiile din memorie după setarea adresei, memoria nu poate transfera datele necesare în perioada T Pentru a împiedica CPU să aștepte sosirea datelor, memoria setează semnalul WAIT la începutul segmentului T Aceasta înseamnă introducerea unor perioade de așteptare (cicluri suplimentare de magistrală) până când memoria resetează semnalul WAIT În exemplul nostru, este introdusă o perioadă de așteptare (T ), deoarece memoria este prea lentă La începutul segmentului T , când există încredere că memoria va primi date în timpul ciclului curent, semnalul WAIT este resetat În prima jumătate a T , memoria plasează date pe liniile de informații La declinul segmentului T , procesorul central strobocizează (adică citește) liniile de informații, stocând valorile acestora în registrul intern După citirea datelor, procesorul resetează semnalele MREQ și RD Dacă este necesar, un alt ciclu de memorie poate începe pe marginea următoare Această secvență poate fi repetată la infinit II specificația de sincronizare din fig , condițional iPn p'iens sunt utilizate Tw, de exemplu, este intervalul de timp dintre muchia ascendentă a lui T, în colțul liniilor de adresă Conform cerințelor de sincronizare I ns Aceasta înseamnă că producătorul procesorului garantează că în timpul celui de-al doilea ciclu de citire, procesorul central va putea emite n critul necesar în ns de la mijlocul frontului Tr Condițiile de sincronizare necesită, de asemenea, ca datele să sosească pe liniile de date cu cel puțin ns (TDS) înainte de rularea T pentru a da timpului de date v |n , I Hz și o lățime de linie de de nanometri Conceptul de "lățime de linie" denotă lățimea conductorilor dintre tranzistori (și, în același timp, determină lățimea tranzistorilor înșiși) Cu cât această valoare este mai mică, cu atât mai mulți tranzistori se potrivesc pe un cip În esență, legea lui Moore prezice capacitatea inginerilor de a reduce și mai mult lățimea liniei Printre altele, reducerea acestei valori vă permite să creșteți frecvența ceasului Pentru comparație, /іvmetrul unui păr uman este de - de microni (mai mult, părul blond nu este închis la culoare) Lansarea originală a arhitecturii Coge i a fost bazată pe arhitectura "Nahalem", dar noile versiuni ale arhitecturii Coge i se bazează pe arhitectura mai nouă "Sandy lliidge" Termenul "arhitectură" în acest context se referă la desemnarea internă a procesorului central, căruia i se atribuie adesea o cale de cod De obicei, arhitecții de calculatoare sunt oameni serioși și uneori vin cu fragmente de cod foarte spirituale pentru proiectele lor De exemplu, arhitecturile din seria K de la AMD trebuiau să distrugă poziția aparent invulnerabilă a lui Intri pe piața procesoarelor desktop Pentru procesoarele din seria K s-a ales numele de cod "Kryptonite" - numele singurei substanțe care l-ar putea dăuna lui Superman, un indiciu plin de duh asupra dominației Intel Noua versiune Core I bazată pe arhitectura Sandy-Bridge a crescut la , miliarde de tranzistori Funcționează la o viteză de , GHz cu o lățime de linie de nanometri Deși Core i este foarte diferit de procesorul cu cei de tranzistori ai săi, este pe deplin compatibil cu și poate rula programe binare scrise pentru (ca să nu mai vorbim de programele pentru toate procesoarele care au apărut între Core i și ) Din punct de vedere software, Coge I este o mașină pe de biți Suportă aceeași arhitectură standard industrială (ISA) ca și procesoarele , , Pentium, Pentium II, Pentium Pro, Pentium III și Pentium , inclusiv aceleași registre, aceleași instrucțiuni și aceeași procesare în virgulă mobilă încorporată standard IEEE În plus, Cor i are noi comenzi destinate în principal operațiunilor criptografice Core I este un procesor multi-core; astfel, substratul de siliciu conține mai multe procesoare Se vinde cu un număr diferit de procese interne - de la la (și numărul acestora ar trebui să crească în viitorul apropiat) Dacă programatorii scriu un program paralel folosind fire și blocări, organizarea execuției paralele pentru mai multe Unele procesoare vor oferi un câștig semnificativ în viteză, este acceptată tehnologia hyper-threading, care permite ca mai multe fire hardware să fie active în același timp Hyperthreading permite comutarea firelor hardware în timpul întârzierilor foarte scurte (de exemplu, pierderile de cache) Comutarea firelor de execuție software poate avea loc numai în timpul întârzierilor foarte mari (cum ar fi erorile de pagină) deoarece implementarea en> necesită sute de cicluri La nivel de microarhitectură, Coge I se bazează pe arhitectura predecesorilor săi Core și Core Duo Procesorul Core I poate executa până la patru instrucțiuni simultan, ceea ce face posibil să îl consideri o mașină superscalară de x Microarhitectura lui Coré i va fi discutată în capitolul Procesoarele Coge i folosesc un cache pe trei niveluri Fiecare procesor Coge I are un cache de date L de KB și un cache de instrucțiuni L de KB Fiecare nucleu are, de asemenea, propriul cache L de KB Cache-ul de al doilea nivel este unificat, adică vă permite să stocați o combinație de comenzi și date Toate nucleele partajează un cache unificat de Nivel (L ), care are o dimensiune de la MB la MB, în funcție de modelul procesorului Cacheul pe trei niveluri îmbunătățește semnificativ performanța procesorului, dar datorită creșterii costului componentelor din siliciu, deoarece cantitatea totală de cache pe un substrat nu poate depăși MB în procesoarele Coge I Deoarece toate cipurile Coge I conțin mai multe procesoare cu propriile cache de date, poate fi dificil pentru unul dintre procesoare să modifice un cuvânt plasat în memoria cache privată Dacă, să zicem, un alt procesor încearcă să citească acest cuvânt din memorie, acesta va obține o valoare învechită, deoarece trece un timp între schimbarea cuvântului și scrierea acestuia în memorie Pentru a menține consistența datelor în memorie, fiecare CPU dintr-un sistem multiprocesor monitorizează magistrala de memorie pentru cererile de cuvinte stocate în cache Dacă o astfel de solicitare este detectată, procesorul furnizează datele necesare înainte ca memoria să le transfere altor consumatori Tehnologia de urmărire va fi tratată în Capitolul Sistemele cu procesor Coge i folosesc două magistrale externe, ambele sunt sincrone Bus-ul de memorie DDR este folosit pentru a accesa memoria RAM dinamică principală; Bus PCI Express - pentru interacțiunea cu dispozitivele de intrare-ieșire Versiunile de înaltă performanță ale Coge i conțin mai multe magistrale de memorie și PCI Express, precum și un port QPI (Quick Path Interconnect) Portul QPI conectează procesorul la o conexiune externă multiprocesor, ceea ce deschide posibilitatea de a construi sisteme cu mai mult de șase procesoare Portul QPI trimite și primește solicitări de coerență a memoriei cache, precum și alte mesaje de control pentru sistemele multiprocesor, cum ar fi întreruperile interprocesor Principala problemă cu Coge i , ca și cu toate procesoarele desktop moderne, este cantitatea de energie consumată și căldura generată Pentru a evita deteriorarea componentelor din siliciu, este necesar să eliminați căldura din procesor imediat după ce este generată Procesoarele Coré i consumă de la la wați în funcție de frecvență și model De aceea hih I sunt într-o căutare constantă de noi soluții care să permită > p" și ѵ să se bucure de problema degajării căldurii Tehnologiile de răcire și transferul de căldură al pachetului joacă un rol important în protejarea împotriva arderii siliciului siliciu Chipurile Coge I sunt furnizate într-un pachet LGA pătrat cu o lungime de , mm Există tampoane pe planul inferior al microcircuitului, iar dintre ele sunt utilizate pentru alimentarea cu energie, iar sunt împământate în scopul suprimării zgomotului Tampoanele sunt plasate sub forma unei matrice de x , iar segmentul său Hi și IV x nu este umplut În plus, alte de locuri au fost ratate de-a lungul perimetrului asimme-іrіenіo, din cauza cărora este exclusă posibilitatea ♦ și montarea corectă a microcircuitului în priză Dispunerea fizică a Cor і și і pii trei Rust fig **************** *************** **************** **** ************ ************************************ * ******** ** ************ ***** * **** * *** * ************** ** ************************************************ *** ************ ************************************ *** * * * ********* ***** ** **** * ****** **** *** ********** ****** ******************** ******** pWWWWWWAV- Itil *##**%** IV FII ІІІ INI ***** ІІІ |"| iftl III #### * - Diagnosticare *-h-Controlul temperaturii - M I este similară cu PCI Express, deși funcționează la jumătate din viteza acestuia din urmă, deoarece patru căi pot oferi o rată de transfer de numai până la , GB/s de date Chipsetul conține suport complet pentru interfețe suplimentare de joc/nary, de obicei necesare pentru jocuri de înaltă performanță cu numeroase dispozitive I/O Chipsetul Coge i este format atât P , cât și suport pentru interfețe SATA, USB, audio, PCIe și memorie flash ICH oferă suport pentru interfețele vechi, inclusiv interfața PCI și funcționalitatea controlerului de întrerupere A Acces la memorie (DMA) Existența unor astfel de cipuri simplifică foarte mult asamblarea a unui computer personal cu drepturi depline calculator Coge I poate implementa întreruperi în același mod ca și (acest lucru din motive de compatibilitate) sau poate utiliza noul sistem de întrerupere cu dispozitivul Advanced Programmable Interrupt Controller (APIC) Core I poate funcționa la oricare dintre mai multe tensiuni prestabilite, dar procesorul trebuie să știe la ce tensiune va funcționa Semnalele de gestionare a puterii sunt utilizate pentru a selecta automat tensiunea de alimentare, pentru a notifica procesorului despre stabilitatea puterii și pentru o serie de alte operațiuni conexe Cu ajutorul lor, se realizează tranziția la diferite stări de somn, care, desigur, sunt unul dintre instrumentele de gestionare a energiei În ciuda mecanismului complex de gestionare a puterii, temperaturile Coge I pot atinge valori foarte mari Un grup de semnale de control al temperaturii permite procesorului să alerteze dispozitivele din jur despre pericolul supraîncălzirii Aceasta include, de exemplu, un semnal dat de CPU atunci când temperatura sa internă depășește °C ( °F) Deși ('dacă temperatura procesorului depășește ° C, probabil că visează deja la pensionare și la un serviciu conștiincios ca încălzitor Cu toate acestea, chiar și la temperaturi atât de exorbitante, nu trebuie să vă faceți griji cu privire la siguranța lui Coge I Dacă senzorii interni detectează că procesorul este pe cale să se supraîncălzească, aceștia declanșează reglarea termică, mecanism care st|X) care reduce generarea de căldură datorită faptului că procesorul funcționează numai în fiecare N-lea ciclu Cu cât valoarea lui N este mai mare, cu atât îngheață mai mult și se răcește mai repede Desigur, trebuie să plătiți pentru termoreglare prin reducerea performanței sistemului Înainte de invenția termoreglării, în cazul răcirii insuficient eficiente, procesorul s-a ars Dovezi ale "vremurilor întunecate" ale controlului temperaturii pot fi găsite pe YouTube (căutați "procesor care explodă") Videoclipul este fals, dar problema este reală, Semnal Un grup de semnale de ceas este responsabil pentru determinarea frecvenței magistralei sistemului Grupul de semnale de diagnosticare este destinat testării și depanării sistemelor conform standardului IEEE JTAG Grupul de semnale de inițializare servește la încărcarea (pornirea) sistemului Semnalul CK este utilizat de procesor pentru a genera diverse impulsuri de ceas la multipli sau fracțiuni ale ceasului sistemului Pentru a face acest lucru, se folosește un dispozitiv numit sistem de buclă blocată cu întârziere sau DLL (Delay-Locked Loop) Grupul de semnale de diagnosticare este destinat testării și depanării sistemelor conform standardului IEEE JTAG (Joint Test Action Group) În cele din urmă, grupul "alte semnale" include semnale eterogene utilizate în diverse scopuri speciale Modul pipelining al magistralei de memorie a procesorului Core i Procesoarele moderne, precum Coge i , au cerințe stricte pentru memoria dinamică Acestea rulează mult mai repede decât poate produce valori ale memoriei dinamice lente, iar această problemă este exacerbată atunci când mai multe procese emit solicitări simultane Pentru ca procesorul să nu funcționeze, este necesară cea mai mare performanță posibilă a memoriei Din acest motiv, magistrala de memorie a procesorului Coré I DDR funcționează în modul pipeline, atunci când pe magistrală au loc până la patru operațiuni simultan Am discutat despre conceptul de pipeline în Capitolul când am vorbit despre procesoare pipeline (vezi Figura ), dar memoria poate fi, de asemenea, pipeline Pentru a face posibil modul pipeline, solicitările către memoria Core I constau în trei etape: Faza de activare a memoriei (ACT) "deschide" linia de memorie dinamică, făcând-o pregătită pentru accesări ulterioare În faza de citire (READ) sau scriere (WRITE), cuvintele individuale ale unei linii de memorie dinamică deschisă sau cuvintele succesive ale liniei curente de memorie dinamică pot fi accesate utilizând modul batch Faza de preîncărcare (PCHRG) "închide" linia curentă a memoriei dinamice și pregătește memoria pentru următoarea comandă de activare Lucrarea pipeline cu memoria procesorului Core I se bazează pe faptul că memoria dinamică DDR pe un microcircuit este formată din mai multe bănci O bancă este un bloc de memorie dinamică care poate fi accesat de procesor în paralel cu alte bănci, chiar și cele situate pe același cip Un cip obișnuit de memorie dinamică DDR conține până la opt bănci Cu toate acestea, specificația interfeței DDR nu permite mai mult de Exemple de priorități centrale Accesuri paralele іrex pentru un canal DDR Diagrama de timp-R fig Figura arată cum Codul I emite apeluri către trei bănci de memorie diferite Accesurile sunt complet suprapuse, astfel încât operațiunile AI pe cipul de memorie dinamică sunt executate în paralel Comunicarea cu comenzile și operațiile ulterioare pe diagrama de timp Săgeți Sh'tsya Autobuz Autobuz O Rio Accesări de memorie prin pipelining prin interfața DDR a procesorului Core I După cum se poate observa din fig , interfața de memorie DDR are patru canale principale de semnal: ceas magistrală (CK), comandă magistrală (CMD), adresă (ADDR) și date (DATE) Semnalul ceasului magistralei CK controlează întreaga funcționare a magistralei Semnalul de comandă CMD indică ce operație este solicitată din memoria dinamică Comanda ACT setează adresa liniei DRAM deschisă de semnalul ADDR La executarea comenzii READ, adresa unei coloane de memorie dinamică este setată folosind semnalele ADDR, iar memoria dinamică emite valoarea citită după un timp fix prin semnalele DATA În cele din urmă, instrucțiunea PCHRG specifică banca căreia i se aplică operația de preîncărcare prin semnalele ADDR În exemplul nostru, comanda ACT trebuie să precedă prima comandă READ pentru aceeași bancă cu două cicluri de vârf DDR , iar datele sunt emise un ciclu după comanda READ În plus, operațiunea PCHRG trebuie să aibă loc la cel puțin două cicluri după ultima operațiune READ pe același banc de heap Paralelismul solicitărilor de memorie se manifestă prin suprapunerea solicitărilor READ către diferite bănci de memorie dinamică Primele două READ-uri către băncile și se suprapun complet, producând rezultate pe ciclurile de magistrală și, respectiv, Apelul banca se suprapune cu primul apel bancar , iar în final a doua citire din banca se suprapune cu apelul banca Cum știe Core I când să se aștepte la returnarea datelor de comandă RI'AD și când să emită o nouă solicitare de memorie? Pentru a face asta, el iiiist simulare completă a activității interne a fiecărui cip DDR conectat În consecință, se așteaptă ca datele să fie returnate într-un ciclu ales corespunzător și știe că operațiunea de preîncărcare nu ar trebui să înceapă decât după două cicluri de la ultima operațiune de citire Coge I poate prezice toate aceste evenimente, deoarece interfața de memorie DDR rulează sincron, astfel încât toate operațiunile necesită un număr bine definit de cicluri de magistrală DDR Chiar și cu toate aceste informații, construirea unei interfețe de memorie DDR de înaltă performanță, complet pipeline, nu este o sarcină banală, necesitând numeroase temporizatoare interne și detectoare de coliziune pentru a implementa procesarea eficientă a cererilor Sistem cu un singur cip Texas Instrumente OMAP Ca al doilea exemplu de procesor, să luăm sistemul Texas Instruments (TI) OMAP cu un singur cip OMAP implementează setul de instrucțiuni ARM, iar domeniul său principal de aplicare este sistemele mobile și încorporate - smartphone-uri, tablete, gadget-uri de internet Un sistem cu un singur cip include o gamă largă de astfel de dispozitive, astfel încât atunci când sunt combinate cu periferice fizice (ecran tactil, memorie flash), se formează un dispozitiv de computer cu drepturi depline OMAP include două nuclee ARM A , acceleratoare suplimentare și numeroase interfețe periferice Organizarea internă a OMAP este prezentată în fig Miezurile ARM A aparțin unei microarhitecturi superscalare cu lățime Substratul OMAP găzduiește și alte trei procesoare acceleratoare: procesorul grafic POWERVR SGX , un procesor de procesare a imaginii (ISP, Image Signal Proccssor) și un accelerator multimedia IVA SGX - oferă un accelerator multimedia eficient vizualizare programabilă ) și poate fi văzută ca analogă cu GPU-urile desktop (deși inferioare acestora în ceea ce privește viteza și puterea) Procesor programabil SP pentru procesarea eficientă a imaginii (operații necesare în camerele digitale puternice) IVAZ implementează codificare și decodare video eficiente, cu performanțe suficiente pentru a suporta aplicații D (cum ar fi dispozitivele portabile de jocuri) De asemenea, sistemul OMAP cu un singur cip conține o gamă largă de interfețe periferice, inclusiv ecrane tactile și controlere cu tastatură, interfețe de memorie dinamică și flash, USB și HDMI Texas Instruments a publicat planuri pentru dezvoltarea seriei de procesoare OMAP Arhitecturile viitoare vor avea cele mai multe - mai multe nuclee ARM, GPU-uri și o varietate de periferice Sistemul OMAP cu un singur cip a apărut pentru prima dată la începutul anului Opa avea două nuclee ARM A care rulau la GHz folosind o implementare de de metri O caracteristică cheie a procesorului OMAP este că efectuează o cantitate semnificativă de calcul cu un consum foarte scăzut de energie, deoarece se concentrează pe dispozitivele mobile alimentate cu baterie Cu cât este mai eficientă arhitectura unui dispozitiv mobil, cu atât mai rar va trebui să pună dispozitivul la încărcare Exemple de procese centrale BARAJ IHOM ■MIG LFDOR •nd L DMM tІgy MMNx KBL XV L IVA-HD P KB SL GPMC extern NAND/NOR EMIF LPDDR ( MHz) SGX D/ D Modem extern sau accelerator o cm DESPRE С С MHz (DDR) Afișaj DSS (DSI/HDMI) CM co co CM co co USB-HS porturi USB-HS Gazdă SDMA Procesarea imaginii Extins" şi ISP SIMCOP UNIPRO Ducati Mhz HSI Bus intern de mare viteză cu suport pentru memorie multicanal RAM L pe cip KV Depanare și urmărire DAP MMCSD (cu DMA) DDR pe biți CryptoDMA Aoceleratoare de securitate AES/SHA J Periferia L Per / emu / coge / abe cm co DESPRE Nutriție Resetați gestionarea sincronizării co Ș cb P£U-o O Orez Structura internă a sistemului cu un singur cip OMAR Procesoarele OMAP au fost selectate cu scopul de a atinge obiectivul principal al consumului de energie IIaco'o GPU-ul, ISP-ul și IVAZ sunt singurele acceleratoare programabile care efectuează calcule eficient la un consum de energie semnificativ mai mic în comparație cu efectuarea acelorași calcule direct pe procesoarele ARM A La consumul maxim de energie, OMAP utilizează doar mW de putere Acesta este aproximativ / din consumul de energie al unui Core I de înaltă performanță OMAP implementează, de asemenea, un mod de repaus foarte eficient; când toate componentele intră în stare de repaus, consumul de energie este de doar de microwați Modurile de repaus eficiente sunt foarte importante pentru dispozitivele mobile care petrec mult timp în modul de așteptare (cum ar fi telefoanele mobile) Cu cât este mai puțină energie consumată în modul de repaus, cu atât telefonul mobil poate rămâne mai mult în standby Pentru a reduce și mai mult consumul de energie, arhitectura OMAP include diverse funcții de gestionare a energiei, inclusiv scalarea dinamică a tensiunii și limitarea puterii Scalarea dinamică a tensiunii permite componentelor să funcționeze mai lent la tensiuni mai mici, reducând foarte mult cerințele de putere Dacă nu aveți nevoie de procesor pentru a efectua calcule la viteză maximă, tensiunea poate fi scăzută - procesorul funcționează mai lent, economisind o cantitate semnificativă de energie Mecanismul de pornire a puterii folosește un principiu și mai activ de gestionare a puterii: o componentă neutilizată este complet oprită și nu consumă energie De exemplu, atunci când utilizatorul nu vizionează un videoclip pe o tabletă, procesorul video IVAZ este complet oprit și nu consumă energie Și invers, în timp ce vizionați IVAZ, efectuează intens munca de decodare a fluxului video, iar două nuclee ARM A "adorm" ! În ciuda specializării lor (economii de energie), nucleele ARM L folosesc o microarhitectură destul de puternică Pentru fiecare ciclu, ei pot decoda și executa până la două instrucțiuni După cum vom afla în capitolul , această viteză de execuție este cea care maximizează performanța microarhitecturii Dar nu trebuie să presupuneți că exact atât de multe comenzi vor fi executate pentru fiecare ciclu de ceas Mai degrabă, este performanța maximă garantată de producător; un nivel care nu va fi depășit de procesor sub nicio formă În multe cicluri de ceas, vor fi executate mai puțin de două instrucțiuni; acest lucru se datorează prezenței "obstacolelor" care încetinesc execuția comenzilor și reduc performanța generală a sistemului Pentru a elimina astfel de constrângeri, ARM A încorporează un sistem puternic de predicție a ramurilor, un planificator de instrucțiuni de resecvențiere și un sistem de memorie extrem de optimizat Sistemul de memorie OMAP conține două cache interne L pentru fiecare dintre procesoarele ARM A ; Cache de instrucțiuni de K și cache de date de K Cache-urile sunt deservite de canale LPDDR duble de putere redusă Standardul LPDDR este un derivat al interfeței standard de memorie DDR , dar utilizează mai puțini conductori și funcționează la tensiuni mai eficiente din punct de vedere energetic În plus, controlerul de memorie conține o serie de optimizări (cum ar fi preluarea prealabilă și suportul de rotație) Deși stocarea în cache va fi tratată în detaliu în Capitolul , merită și acum câteva cuvinte Toată memoria principală este împărțită în linii cache (blocuri) formate din de octeți Primul nivel cache stochează cele de linii de instrucțiuni cele mai utilizate și cele de linii de date cele mai utilizate Liniile cache care sunt intens utilizate, dar nu se potrivesc în cache-ul de primul nivel sunt stocate în cache-ul de al doilea nivel Acest cache conține atât linii de date, cât și linii de comandă de la ambele procesoare ARM A amestecate într-un mod arbitrar Cache-ul de al doilea nivel conține de linii de memorie principală care au fost accesate ultima dată La o pierdere a memoriei cache de la primul nivel, procesorul trimite identificatorul de linie căutată în memoria cache de nivel al doilea Răspunsul conține informații prin care procesorul poate determina dacă linia specificată este stocată în memoria cache de nivel al doilea și, dacă este stocată, în ce stare Dacă linia este în cache, procesorul o primește Obținerea datelor din memoria cache de al doilea nivel durează cicluri Așteptarea este destul de lungă, așa că programatorii calificați optimizează ("urlă" programul astfel încât să folosească mai puține date; crescând astfel probabilitatea ca datele să se afle într-un cache rapid de prim nivel Dacă o linie de cache nu se află în memoria cache L , aceasta este încărcată din memoria principală prin interfața de memorie LPDDR Interfața LPDDR din OMAP este pe cip, permițând OMAP să comunice direct cu memoria dinamică Pentru a accesa memoria, procesorul trimite mai întâi partea superioară a adresei către cipul de memorie dinamică de-a lungul a linii de adrese Această operație, numită "activare" (ACTIVARE), încarcă întreaga linie de memorie din memoria dinamică în buffer-ul de linie În consecință, procesorul poate emite mai multe comenzi READ sau WRITE, trecând restul adresei pe aceleași linii de adresă și trimițând (sau primind) date pentru operarea pe de linii de date Exemple de procesoare În așteptarea rezultatelor, procesorul poate face alte lucrări De exemplu, o pierdere a memoriei cache în timpul preluării instrucțiunilor nu împiedică executarea uneia sau a mai multor instrucțiuni deja preluate, fiecare dintre acestea putând implica date care nu se află în nicio memorie cache În acest fel, chiar și un procesor poate avea mai multe tranzacții nefinalizate pe două interfețe LPDDR Controlerul de memorie /Іініжэіі urmărește evenimentele curente și emite solicitări în memorie cel mai mult și eu sunt în ordinea următoare Datele din memorie pot veni în bucăți de octeți O operație de memorie poate folosi o citire sau o scriere în modul batch, care anulează sau scrie mai multe adrese contigue într-o singură linie de memorie dinamică Acest mod este eficient în special pentru citirea sau scrierea blocurilor cache Descrierea OMAP dată mai sus (precum și descrierea care o precedă (ne і ) este mult simplificată, dar esența a ceea ce se întâmplă este reflectată în ea Cipul OMAP conține de pini într-un pachet BGA (Fig ) Pachetul BGA (Bal! Grid Aggau) este similar cu LGA, dar în loc de plăcuțele pătrate neutilizate în LGA, folosește bile mici de metal Dgp două tipuri de cazuri sunt incompatibile, ceea ce demonstrează încă o dată pe bună dreptate zicala "nu poți astupa o gaură rotundă cu un dop pătrat" Pinii OMLR formează o matrice dreptunghiulară de x , în care conține două inele interioare de bile, precum și două sub-rânduri și semi-coloane asimetrice pentru a elimina posibilitatea instalării incorecte a microcircuitului în priza BGA Orez Cip al sistemului cu un singur cip OMAP Este dificil să compari un cip CISC (cum ar fi Cope I ) cu un cip RISC (cum ar fi OMAP ) doar pe baza vitezei de ceas De exemplu, V din două nuclee ARM A , viteza maximă de execuție atinge patru instrucțiuni per iact; în acest sens, OMAP aproape se compară cu procesoarele superscalare cu lățimi ale lui Cope i Cu toate acestea, Coge i rulează programe mai rapid, deoarece conține până la șase procesoare, tactate de , ori mai rapid ( , GHz) decât OMAP Poate părea că OMAP seamănă cu o țestoasă care încearcă să depășească un iepure de câmp Coge i , dar țestoasa consumă mult mai puțină energie și va fi prima care va ajunge la linia de sosire - mai ales dacă încărcarea bateriei iepurii nu este prea mare ilvvv j nivel logic digital Microcontroler Atmel ATmegal Coge i și OMLR sunt procesoare de înaltă performanță concepute pentru a crea dispozitive de calcul de mare viteză (Core i este conceput pentru computere desktop, OMAP este pentru sisteme mobile) Există însă și alte computere, de fapt mult mai numeroase - așa-numitele sisteme embedded În această secțiune, îi vom cunoaște Nu este exagerat să spunem că practic orice dispozitiv electronic care valorează mai mult de USD conține un computer încorporat Televizoarele, telefoanele mobile, secretarele electronice, cuptoarele cu microunde, camerele video, aparatele video, imprimantele laser, sistemele de alarmă împotriva intrușilor, aparatele auditive, jocurile electronice și multe alte dispozitive (lista este nesfârșită) sunt controlate de un computer În acest caz, se pune accent nu pe performanța ridicată, ci pe costul redus al unui computer încorporat, ceea ce duce la un echilibru ușor diferit de avantaje și dezavantaje față de procesoarele despre care am discutat până acum Am menționat în Capitolul că ATmegal este în prezent cel mai comun microcontroler O astfel de popularitate se datorează în primul rând costului său scăzut După cum veți vedea în curând, ATmegal este un IC versatil care este foarte ușor și ieftin de conectat la alte dispozitive Structura sa fizică este prezentată în Fig După cum puteți vedea din figură, ATmegal este de obicei furnizat într-un pachet standard cu de pini (deși alte pachete sunt disponibile pentru aplicații specifice) O anumită ciudățenie a acestui cip în comparație cu cele două exemple anterioare este imediat evidentă: nu are linii de adresă și linii de date Faptul este că microcircuitul nu este proiectat pentru a fi conectat la memorie - doar la dispozitive Toată memoria (statică și flash) este conținută în procesorul însuși, eliminând nevoia de adrese separate și linii de date (Figura ) PC cu \ DOP CZ PD EZ PD C PD C PD C VCCtZ GNDC РВ □ РВ [Z PD CZ PD C PD □ RVO □ L / Z PC ZJ PC Z] RSZ □ PC ZI PC Z RCO ZI GND ZI AREF Z] AVCC ZI РВ Z] PB ZI RVZ ZI PB ZI РВ PC cu \ PD C PD C PD CZ PD C PD C VCCCZ GNDC РВ С РВ □ PD □ PD □ PD C RVO □ / ZI PC □ PC Z RSZ Z] PC □ PC □ RSO ZI GND □AREF ZJ AVCC □ RV □ RV ZI RVZ □ RV ZI РВ Orez Aspectul fizic al cipului ATted! Orez Arhitectura internă și aspectul logic al ATmegal În loc de linii de adrese și linii de date, ATmegal conține de porturi I/O digitale, linii de porturi B și D și linii de porturi C Liniile de I/O digitale sunt destinate pentru conectarea dispozitivelor I/O periferice și programul de inițializare poate seta modul de funcționare inter-linie (intrare sau ieșire) De exemplu, atunci când este utilizat într-un cuptor cu microunde, o linie digitală poate primi intrare de la un senzor deschis iar celălalt - pentru a da un semnal de ieșire pentru a porni și opri i II * I generator Înainte de a porni generatorul cu microunde, software-ul L GtecaKiI verifică dacă ușa cuptorului este închisă Dacă ușa se deschide brusc, programul ar trebui să oprească urgent alimentarea Cu toate acestea, în practică, blocarea hardware este întotdeauna utilizată În plus, cele șase linii ale portului C pot fi configurate pentru intrare/nod analogic Liniile analogice I/O pot citi nivelul tensiunii de intrare și pot seta nivelul tensiunii de ieșire Deci, în contextul exemplului anterior, unele cuptoare cu microunde au un senzor care permite aragazului să încălzească alimentele la o temperatură predeterminată Senzorul de temperatură al nodului este conectat la intrarea portului C, programul citește tensiunea senzorului și convertește temperatura utilizând funcția de conversie pentru o anumită dată Liniile rămase ale ATmegal sunt intrarea de putere (VCC), două legături " ore de ieșiri pentru întregul set de semnale de adresă și informații, chiar dacă PCI funcționează cu adrese pe de biți și date pe de biți Ieșirile combinate de adrese și date abia dacă funcționează Când este citită în timpul primului ciclu, șoferul transferă adresa către autobuz În timpul celui de-al doilea ciclu, masterul elimină adresa și comută magistrala astfel încât slave să o poată utiliza În timpul celui de-al treilea ciclu, slave i-a dat datele solicitate Când scrieți, magistrala nu trebuie să comute, deoarece șoferul îi transmite atât adresa, cât și datele Cu toate acestea, tranzacția cu acțiuni minime durează trei cicluri Dacă dispozitivul slave nu poate răspunde în trei cicluri, atunci se intră în modul de așteptare Sunt permise transferuri nelimitate în bloc, precum și alte tipuri de cicluri de autobuz Arbitrajul magistralei PCI Pentru a utiliza magistrala PCI, dispozitivul trebuie mai întâi să o poată accesa Busul PCI este controlat de un arbitru centralizat, așa cum se arată în Fig , În cele mai multe cazuri, arbitrul de autobuz este încorporat într-unul dintre podurile de autobuz Două linii dedicate* rulează de la fiecare dispozitiv PCI la arbitru Unul dintre ele (REQ#) este folosit pentru a solicita magistrala, iar al doilea (GNT#) pentru a obține permisiunea de a accesa magistrala (Notă: REQ# reprezintă REQ în terminologia PCI ) Orez , Autobuzul PCI are un arbitru centralizat Pentru a face o cerere de acces la magistrală, dispozitivul PCI (inclusiv CPU) setează semnalul REQ# și așteaptă până când arbitrul setează semnalul GNT# Dacă arbitrul setează semnalul GNT#, atunci dispozitivul poate folosi magistrala în ciclul următor Algoritmul care ghidează Exemple de anvelope MB Hg este definit în specificația magistralei PCI Este permis arbitrajul prioritar ciclic, precum și alte scheme de arbitraj Desigur, Arbitrul trebuie să fie corect, pentru a nu forța aranjamente individuale pentru eternitate este prevăzută pentru o singură tranzacție, deși durata acestei ^^Craction este teoretic nelimitată Dacă un dispozitiv trebuie să comite o tranzacție și niciun alt dispozitiv nu solicită autobuzul, acesta poate fi din nou pe magistrală, deși de obicei necesită inserarea unei bucle între tranzacții Cu toate acestea, în circumstanțe speciale (în absența unei dispute la un vârf), un dispozitiv poate face tranzacții consecutive ^^Trebuie să circule între ele Dacă masterul transmite foarte prost și un alt dispozitiv a emis o cerere de acces, arbitrul poate reseta semnalul pe linia GNT# Se presupune că dispozitivul Idoncse monitorizează linia GNT#, iar la resetare, dispozitivul va elibera magistrala în ciclul următor Un astfel de sistem permite transmisii foarte lungi (ceea ce este foarte rațional) în absența restricțiilor de acces la magistrală, dar în același timp răspunde rapid la solicitările NIM de la alte dispozitive ■ Bus PCI YGIbble VINA IGP acceptă un număr de MGNAL obligatorii (Tabelul ) și un număr de MGNAL opționale (Tabelul ) Pinii rămași sunt folosiți pentru alimentare, împământare și o varietate de semnale aferente În coloanele "Driver* || ^Dispozitiv sclav" specifică ce dispozitiv setează semnul |NUI într-o tranzacție normală Dacă semnalul este setat de un alt dispozitiv ^Exemplu, CLK), ambele coloane sunt lăsate necompletate Tabelul Semnale obligatorii de magistrală PCI Semnal Număr de linii Master Slave Comentariu CI K generator de ceas ( MHz sau MHz) Al) Da Da Adresă și linii de date combinate PAR Da Bit de paritate pentru adresa sau date ('/BE# Da În primul rând, o comandă către magistrală, în al doilea rând, un bitmap care indică ce octeți din cuvânt ar trebui să fie citiți (sau scrieți) l'RAME# Da Indică faptul că semnalele AD și C/BE sunt setate IRDY# DA Când este citit, înseamnă că masterul este gata să primească date; la scriere - că datele sunt în magistrală continuare & Tabelul (continuare) Semnal Număr de linii Master Slave Comentariu IDSEL Da Citiți spațiul de configurare DEVSEL# Da Slavul și-a recunoscut adresa și așteaptă un semnal TRDY# Da Când citiți, înseamnă că datele sunt pe liniile AD; când scrieți că dispozitivul slave este pregătit să primească date STOP# Da Slave cere să nu anuleze încet tranzacția curentă PERR# Eroare de paritate a datelor detectată SERR# Paritatea adresei sau eroarea de sistem a fost detectată REQ# Arbitraj autobuz - Solicitare acces autobuz GNT# Arbitraj pentru autobuze - Grant autobuz RST# Reporniți sistemul și toate dispozitivele Tabelul Semnale suplimentare de magistrală PCI Semnal Număr de linii Master Slave Comentariu REQ # Da Solicitare pentru o tranzacție pe de biți ACK # Da Activați tranzacția pe de biți AD Da de biți suplimentari de adresă sau date PAR Da Paritate pentru de biți suplimentari de adresă sau date C/BE# Da biți suplimentari pentru a indica ce octeți ai cuvântului să citească (sau să scrie) C-SC Da În sistemele multiprocesor, blocarea magistralei atunci când o tranzacție este efectuată de unul dintre procesoare F Exemple de anvelope ІШіи irі іy e| Și INI ÎN Gn HM" Minn N Numărul de linii Master Slave Comentariu În sistemele multiprocesor, accesarea memoriei cache a altui procesor În sistemele multiprocesor, semnalul pentru finalizarea monitorizării Cerere de întrerupere semnale de testare IEEE JTAG Semnal conectat la sursa de alimentare sau la masă ( MHz sau MHz) Ііііісрі" să ne uităm la fiecare semnal al magistralei PCI separat Să începem • semnale nGіiiiііігглpy ( de biți), apoi treceți la rândul suplimentar I M pіі i) Semnalul CLK controlează magistrala Cele mai multe dintre semnalele de intrare sunt conectate cu acesta Pe magistrala PCI, o tranzacție începe la căderea semnalului CLK, în acest sens n Hі і ni іе іyіo secvența de zero biți este greu de distins de inactiv • noi și Această problemă este rezolvată cu ajutorul așa-numitului cifru de / biți În această schemă, octet de date reale este codificat cu un caracter de biți Din de caractere posibile pe biți, le puteți alege pe cele care, datorită unui număr suficient de fronturi, fără un • ♦Jocurile muntelui asigură sincronizarea expeditorului și destinatarului de-a lungul limitelor ііninі Datorită utilizării codificării pe / biți, debitul total • Lățimea de bandă a legăturii, egală cu , GB/s, se restrânge la debitul real > im nbiosti GB/s Stratul de legătură este responsabil pentru transmiterea pachetelor La acest nivel, un număr de serie și un cod de corectare a erorilor, la antetul trimis de la nivelul tranzacției se adaugă așa-numitul CRC (Cyclic Redundancy Check) Codul CRC este generat prin aplicarea unui algoritm specific antetului și sarcinii utile La primirea unui pachet, dispozitivul efectuează calcule similare cu antetul și datele și compară rezultatul cu valoarea specificată în pachet Dacă cele două acreditări se potrivesc, un pachet de validare este trimis înapoi expeditorului inițial pentru a verifica corectitudinea datelor primite În caz contrar, destinatarul nu va solicita o retransmitere Astfel, în hui sunt mult crescute de exemplu, geluri de integritate a datelor în comparație cu magistrala PCI, în care nu există rebook-uri de mijloace de control și retransmitere a datelor Pentru a evita supraîncărcarea unui receptor lent cu pachete care ies de la un expeditor rapid, este implementat un mecanism de control al fluxului Acest mgmanizm se bazează pe eliberarea de către destinatar către expeditor a unui anumit număr de permisiuni pentru transmiterea pachetelor - în funcție de cantitatea de spațiu necesară pentru stocarea acestora După ce a epuizat permisiunile acordate anterior, expeditorul trebuie să suspende transmisia și să consume noi permisiuni O astfel de schemă, comună în toate rețelele, previne pierderea datelor din cauza nepotrivirii vitezelor de trimitere • mn şi destinatarul La nivel de tranzacție, toate operațiunile cu magistrala sunt efectuate De exemplu, pentru a citi un cuvânt din memorie, trebuie efectuate două tranzacții, dintre care una este inițiată de procesorul sau canalul DMA care solicită date, cealaltă de un obiect valoros (furnizor de date) Cu toate acestea, citirea și scrierea nu sunt singurele migrări care sunt efectuate la nivel de tranzacție Acest strat, în special, extinde capacitățile de transfer de pachete furnizate de stratul de legătură Fiecare bandă la nivel de canal este subdivizată în mai multe (până la opt) canale virtuale, fiecare transportând date de unul sau altul La nivel de tranzacție, pachetele sunt marcate în funcție de clasa de trafic i, care definește un număr de proprietăți precum "prioritate mare", "prioritate scăzută", "fără urmărire", "livrare în afara secvenței permisă" și i e Comutatorul se bazează pe informații despre token, printre altele, pentru a determina ordinea în care sunt procesate pachetele Orice tranzacție are loc în unul dintre cele patru spații de adresă: + spațiu de memorie (când se efectuează operații standard de citire și scriere); + spațiu I/O (pentru adresarea registrelor dispozitivului); + spațiu de configurare (pentru inițializarea sistemului etc ); + spațiu pentru mesaje (pentru trimiterea de semnale, întreruperi etc ) Memoria și spațiile I/O sunt similare cu cele tradiționale care sunt implementate în sistemele moderne În spațiul de configurare, este posibilă implementarea diferitelor tipuri de mecanisme, de exemplu, configurația automată (APC) Spațiul de mesaje își asumă astăzi funcțiile numeroaselor semnale de control Este imposibil să faci fără acest spațiu, deoarece în PCI Express nu există linii de control prevăzute în magistrala PCI Stratul software acționează ca un intermediar între PCI Express și sistemul de operare Printre altele, oferă un mod de emulare a magistralei PCI care vă permite să instalați sisteme de operare vechi în computerele echipate cu PCI Express fără nicio modificare Desigur, atunci când se lucrează în astfel de condiții, implementarea tuturor caracteristicilor PCI Express nu este fezabilă, dar compatibilitatea inversă este o măsură necesară - cel puțin până când toate sistemele de operare acceptă pe deplin PCI Express Experiența arată că acest proces va dura mult timp Fluxul de informații tipic pentru PCI Express este prezentat în fig b Comanda care ajunge la nivelul programului este transmisă la nivelul tranzacției, de unde se formează antetul și sarcina utilă Apoi aceste componente sunt trimise la stratul de legătură, unde antetul pachetului * este setat la un număr de secvență, iar coada este setată la un cod CRC Apoi, pachetul extins este trecut la stratul fizic, unde parametrii de cadru sunt adăugați la ambele capete, iar pachetul fizic rezultat este transmis de la expeditor la destinatar Pe partea destinatarului, are loc procesul invers - antetul și coada cadrului la nivel de legătură sunt eliminate, iar rezultatul este transferat la nivelul tranzacției Conceptul de atașare a datelor suplimentare la fiecare strat ulterior al stivei de protocoale a fost folosit în rețelele de calculatoare de foarte mult timp și cu succes Principala diferență dintre tehnologiile de rețea și PCI Express este că, în primul caz, codul care operează la diferite niveluri ale stivei este aproape întotdeauna software și este controlat de sistemul de operare În PCI Express, pe de altă parte, operațiunile la toate nivelurile sunt implementate în hardware Structura PCI Express este destul de complexă Descrierea sa detaliată este disponibilă în [Mayhewand Krishnan, ; Solari și Congdon, ] În plus, tehnologia continuă să evolueze - în , a fost lansată versiunea PCIe Acceptă MB/s pe canal și până la de canale pentru o lățime de bandă totală de până la GB/s În , a fost lansată versiunea PCIe , care a schimbat codificarea de la / -bit la / -bit, cu capacitatea de a efectua până la miliarde de tranzacții pe secundă - de două ori mai mult decât PCIe Autobuz USB Deși PCI și PCI Express sunt foarte potrivite pentru conectarea perifericelor de mare viteză, utilizarea interfeței PCI pentru dispozitive I/O cu viteză redusă (cum ar fi șoarecii și tastaturile) a fost ineficientă Inițial, fiecare dispozitiv I / O standard mi / nnya 'ios cu computerul într-un mod special, în timp ce sloturile ISA și PCI gratuite au fost folosite pentru a adăuga altele noi și iroyc gv Din păcate, așa ♦ N'MP are unele dezavantaje De exemplu, fiecare dispozitiv I/O nou este adesea echipat cu propriul card ISA sau PCI În același timp, utilizatorul trebuie să seteze el însuși ngrk/po'iatsli și jumperii pe placă și să se asigure că placa configurată nu se nіpіf/іktuet cu alte plăci Apoi utilizatorul trebuie să deschidă sistemul N'Ny\, să introducă cu atenție placa, să închidă unitatea de sistem și să pornească computerul Pentru mulți, acest proces este foarte complicat și duce adesea la erori În afară de asta, numărul de sloturi ISA și PCI este foarte mic (de obicei două sau trei) Plăcile configurate automat (PPR) elimină nevoia de a seta comutatorul și urii, dar utilizatorul trebuie totuși să deschidă computerul și să introducă placa În plus, numărul de sloturi de autobuz este limitat În , șapte companii (Compaq, DEC, IBM, Intel, Mhhisoft, NEC și Northern Telecom) s-au reunit pentru a dezvolta un autobuz care era cel puțin potrivit pentru conectarea dispozitivelor cu viteză redusă Apoi i s-au alăturat sute de alte companii Rezultatul muncii lor a fost magistrala UNII (U nivcrsal Serial Bus - Universal Serial Bus), care este încă utilizat pe scară largă în computerele personale Mai multe detalii • Legenda USB este dată în literatură [Anderson, ; Apăsați ] Câteva dintre cerințele care au stat inițial la baza proiectului: ♦ utilizatorii nu trebuie să instaleze întrerupătoare și jumperi pe plăci și dispozitive; і utilizatorii nu trebuie să deschidă computerul pentru a instala noi dispozitive I/O; ♦ să existe un singur tip de cablu adecvat pentru conectarea tuturor dispozitivelor; > Dispozitivele I/O trebuie alimentate prin cablu; ar trebui să fie posibil să se conecteze până la de dispozitive la un computer; і sistemul trebuie să suporte dispozitive în timp real (ex dispozitive de sunet, telefon); + ar trebui să fie posibilă instalarea dispozitivelor în timp ce computerul rulează; + instalarea unui dispozitiv nou nu ar trebui să necesite repornirea computerului; + Producția unei noi magistrale și a dispozitivelor I/O pentru aceasta nu ar trebui să fie costisitoare Busul USB îndeplinește toate aceste condiții Este conceput pentru dispozitive cu viteză redusă (tastaturi, șoareci, camere, scanere, digitale iesit telefoane si g e) Debitul total al primei versiuni a spike (USB ) a fost de , Mbps Versiunea rulează la Mbps, cipul este suficient pentru imprimante, camere digitale și multe alte dispozitive Versiunea acceptă dispozitive de până la Mbps, suficient pentru a suporta unități externe, camere web de înaltă definiție și interfețe de rețea Versiunea recent lansată de USB a crescut viteza la Gb/s; doar timpul va spune ce aplicații noi și solicitante va da naștere această interfață ultra-rapidă Busul USB constă dintr-un hub rădăcină care se conectează la conectorul magistralei principale (vezi Figura ) Acest hub rădăcină (denumit adesea hub rădăcină) conține conectori pentru cabluri care pot fi conectate la dispozitive I/O sau hub-uri suplimentare pentru a crește numărul de conectori Astfel, topologia magistralei USB este un arbore înrădăcinat la hub-ul rădăcină care se află în interiorul computerului Conectorii de cablu de pe partea dispozitivului sunt diferiți de conectorii de pe partea de hub, astfel încât utilizatorul să nu conecteze accidental cablul cu cealaltă parte Cablul este format din patru fire: două dintre ele sunt pentru transmiterea datelor, unul pentru alimentare (+ V) și unul pentru masă Sistemul transmite cu o schimbare de tensiune și fără schimbare de tensiune, astfel încât o secvență lungă de biți zero generează un flux de impulsuri regulate Când este conectat un nou dispozitiv I/O, hub-ul rădăcină detectează acest fapt și închide sistemul de operare Sistemul de operare interogează apoi noul dispozitiv pentru a afla ce este acesta și câtă lățime de bandă a magistralei necesită Dacă sistemul de operare decide că există suficientă lățime de bandă pentru acest dispozitiv, îi atribuie o adresă unică ( - ) și încarcă această adresă și alte informații în registrele de configurare din cadrul dispozitivului Astfel, noi dispozitive pot fi conectate din mers, în timp ce utilizatorul trebuie să instaleze noi carduri ISA sau PCI Plăcile neinițializate încep la adresa , astfel încât să poată fi accesate Multe dispozitive au hub-uri de rețea încorporate pentru dispozitive suplimentare De exemplu, un monitor poate conține două hub-uri pentru difuzoarele din dreapta și din stânga Autobuzul USB este o serie de canale între hub-ul rădăcină și dispozitivele I/O Fiecare dispozitiv își poate împărți canalul în până la sub-canale pentru diferite tipuri de date (de exemplu, audio și video) În fiecare canal sau subcanal, datele se mută de la hub-ul rădăcină la dispozitiv și invers Nu există schimb de informații între cele două dispozitive I/O Exact la fiecare milisecundă (± , ms), hub-ul rădăcină trimite un nou cadru pentru a sincroniza toate dispozitivele în timp Cadrul este format din pachete, primul fiind transmis de la hub la dispozitiv Următoarele pachete ale cadrului pot fi transmise în aceeași direcție, sau în direcția opusă (de la dispozitiv la hub) Pe fig arată patru cadre consecutive ■OF Timp, ms am crezut miez I ID de date Nici un dispozitiv Orez , Hub-ul rădăcină al magistralei iZV transmite cadre la fiecare milisecundă Cadrele și nu fac nimic, așa că conțin doar un singur pachet SOF (Start of Frame) Acest pachet nu este trimis întotdeauna către niciun dispozitiv Cadrul este o solicitare ordonată (de exemplu, send-i ii către scaner și o solicitare de a trimite biți din imaginea scanată) Cadrul constă în trimiterea de date către un dispozitiv (de exemplu, o imprimantă) III USB acceptă tipuri de cadre: cadre de control, nuclee izocrone, cadre de transfer de date în bloc și cadre de întrerupere Cadrele de control sunt folosite pentru a configura dispozitivele, pentru a trimite comenzi către dispozitive și către noi și pentru a interoga starea acestora Cadrele izocrone sunt destinate dispozitivelor în timp real (microfoane, difuzoare și telefoane) care trebuie să primească și să trimită date pe intervale de timp egale Întârzierile sunt bine prezise, dar în cazul unei erori, astfel de dispozitive vor retransmite Cadrele de tipul următor sunt utilizate pentru transferuri de volum mare de la și către dispozitive (de exemplu imprimante) ale cerințelor specifice dispozitivelor în timp real În cele din urmă, sunt necesare cadre de acest din urmă tip, deoarece magistrala USB nu acceptă întreruperi De exemplu, pentru a nu declanșa o întrerupere de fiecare dată când este apăsată o tastă, sistemul de operare poate interoga tasta la fiecare de milisecunde și poate "colecta" toate datele brute de apăsare a tastei Un cadru este format din unul sau mai multe pachete Pachetele pot trimite -i a în ambele direcții Există patru tipuri de pachete: jetoane, pachete de date, pachete de strângere de mână și pachete speciale Tokenurile sunt transmise de la hub la dispozitiv și sunt destinate să controleze sistemul Pachetele SOF, IN și OUT din fig - markere Pachetul SOF (Start of Frame) este primul din orice cadru, identifică începutul cadrului Dacă nu este necesară nicio acțiune, pachetul SOF este singurul din cadru Pachetul IN este o solicitare Acest pachet necesită ca dispozitivul să furnizeze anumite date Câmpurile din pachetul IN conțin informații despre ce capal este solicitat, iar din aceste informații dispozitivul determină ce date să emită (dacă manipulează mai multe fluxuri de date) ur* / Pachetul OUI anunță că va urma transferul de date pentru dispozitiv Ultimul tip de token, SETUP (neprezentat în figură), este utilizat în configurare Pe lângă marcatori, există alte trei tipuri de pachete Acestea sunt pachete de date (sunt folosite pentru a transfera de octeți de informații în ambele direcții), pachete de confirmare și pachete speciale Formatul pachetului de date (DATA) este prezentat în fig , Acesta constă dintr-un câmp de sincronizare pe biți, un identificator de tip de pachet (PID) de biți, o sarcină utilă și un cod CRC de biți pentru detectarea erorilor Există trei tipuri de pachete de confirmare: ACK (pachetul de date anterior primit corect), NAC (eroare CRC găsită) și STAI A (dispozitiv ocupat, vă rugăm să așteptați) Acum să ne uităm la Fig , Hub-ul rădăcină trebuie să trimită un cadru la fiecare milisecundă, chiar dacă nu se întâmplă nimic Cadrele și conțin un singur pachet SOF, ceea ce indică faptul că nu se întâmplă nimic Cadrul este sondaj, deci începe cu pachetele SOF și IN de la computer la dispozitivul I/O, urmate de un pachet de DATE de la dispozitiv la computer Pachetul ACK spune dispozitivului că datele au fost primite fără erori În cazul unei erori, dispozitivul primește un pachet NACK, după care datele sunt retransmise (rețineți că datele izocrone nu sunt retransmise) Cadrul este similar ca structură cu cadrul , dar fluxul de date este de la computer la dispozitiv După ce standardul USB a fost aprobat în sfârșit în , dezvoltatorii au început să creeze următoarea versiune de mare viteză a USB, numită USB Acest standard este în multe privințe similar cu USB și este compatibil cu acesta, totuși, la cele două viteze anterioare se adaugă unul nou - Mbps Toate celelalte modificări, inclusiv implementarea unei noi interfețe între hub-ul rădăcină și controler, nu sunt atât de semnificative Standardul USB a furnizat două interfețe UHCI și ONSI Interfața UHCI (Universal Host Controller Interface - o interfață universală de controler gazdă) a fost dezvoltată de Intel, transferând majoritatea grijilor către programatori (a se citi - la Microsoft) Programatorii le-au întors favoarea și au lansat interfața ONSI (Open llost Controller Interface - o interfață deschisă de controler gazdă), punând munca principală pe dezvoltatorii de hardware (a se citi - Intel) În timpul dezvoltării standardului USB , părțile au ajuns la o soluție reciproc acceptabilă prin lansarea unei noi interfețe numită ENCI (Enhanced Host Controller Interface - o interfață îmbunătățită a controlerului gazdă) Deoarece magistrala USB transferă acum date la Mbps, aceasta devine un concurent serios pentru magistrala serială IEEE (FireWire) care operează la Mbps sau Mbps Deoarece aproape toate sistemele moderne bazate pe Intel sunt echipate cu USB sau USB (vezi mai jos), standardul va deveni în curând un lucru al trecutului, iar motivul principal al dispariției sale nu va fi învechirea, ci lupta pentru influență USB este un produs al industriei computerelor, iar standardul își are originea în lumea electronicelor de larg consum Când vine vorba de conectarea unei camere la un computer, fiecare parte vrea să-și folosească propria interfață Se pare că "calculatoarele" au câștigat această luptă La opt ani de la lansarea USB , a fost anunțat standardul de interfață USB USB acceptă o lățime de bandă uimitoare i I bi/s, deși viteza maximă este probabil să fie atinsă numai cu cabluri pro(|aproape avansate) Dispozitivele USB sunt identice cu dispozitivele USB anterioare și implementează pe deplin standardul USB Prin urmare, atunci când sunt conectate la un Conector USB , un dispozitiv • USB va funcționa normal Interfețe I Un sistem informatic de dimensiuni mici sau mijlocii constă dintr-un procesor micro-meme, cipuri de memorie și mai multe dispozitive I/O Toate cipurile pi sunt conectate printr-o magistrală Uneori, toate aceste dispozitive sunt integrate într-un sistem cu un singur cip, ca în cazul TI OMAP Le-am luat deja în considerare, unități centrale de procesare și autobuze Acum este timpul să explorați interfețele I/O Prin aceste microcircuite computerul face schimb de informații cu dispozitive externe G Interfețe I/O II În prezent, există multe interfețe de intrare-pynode diferite și interfețe noi apar în mod constant Cele mai comune sunt UART-urile, USART-urile, controlerele CRT, disc fonrollsry și Ryu UART (Transmițător receptor universal asincron - (nici un emițător-receptor asincron real) este o interfață I/O care poate citi un octet din magistrala de date și poate transfera acel octet bit cu bit și linia de transfer serial către sau de la terminal Viteza ribogiei microcircuitelor UART este diferită: de la la bps; lățimea caracterelor de la k biți; , , sau biți de oprire; cu paritate pară sau impară, cioturi fără ea - totul este controlat de software USART (Universal Synchronous Aivnchronous Receiver Transmitter - emițător-receptor universal sincron-asincron) poate efectua transmisie sincronă folosind o serie de protocoale și, de asemenea, acceptă toate funcțiile cipului UART Deoarece interfața UART nu mai joacă un rol vizibil în modemurile telefonice timpurii, vom considera interfața RIO paralelă ca un exemplu de cip I/O interfețe PIO Un bun exemplu de interfață PYU (Intrare/Ieșire paralelă - intrare-ieșire paralelă) este cipul Intel A (Fig ) Conține > pini I/O și poate interfața cu orice dispozitiv digital (de exemplu, tastaturi, comutatoare, indicatoare, imprimante) Software-ul CPU poate scrie sau pe orice linie sau poate citi starea de intrare a oricărei linii, oferind o mare flexibilitate Un mic sistem bazat pe procesor care utilizează interfața PIO poate controla o mare varietate de dispozitive fizice - roboți, tonuri de gri, microscoape electronice Cel mai adesea interfețele Ryu întâlnesc sisteme gen, dar încorporate cs A -A WR RD Reinstalare D -D Orez , Cip Ѳ A Configurația interfeței RIO este definită de un registru de biți care specifică dacă trei porturi independente de biți trebuie utilizate pentru intrarea digitală ( ) sau ieșirea digitală ( ) Scrierea valorii adecvate în registrul de configurare permite combinarea arbitrară de I/O pe cele trei porturi Fiecare port are asociat un registru de biți Pentru a configura linii pe port, CPU scrie un număr de biți în registrul corespunzător, iar acel număr de biți apare pe liniile de ieșire și rămâne acolo până când registrul este suprascris Pentru a utiliza un port pentru intrare, CPU-ul citește pur și simplu registrul corespunzător De asemenea, este posibil să se construiască interfețe RJ mai complexe De exemplu, un mod popular implică strângere de mână cu dispozitive externe De exemplu, pentru a trimite date către un dispozitiv, A ar putea trimite date la un port de ieșire și poate aștepta până când dispozitivul semnalează că datele au fost primite și mai multe pot fi trimise Microcircuitul include circuitele logice necesare pentru fixarea unor astfel de semnale și transmiterea lor către procesorul central Din schema funcțională a RJ din fig vedem că în plus față de de pini pentru trei porturi, cipul A conține opt linii conectate direct la magistrala de date, o linie de selecție a elementelor de memorie, linii de citire și scriere, două linii de adresă și o linie pentru resetarea cipului Două linii de adresă vă permit să selectați unul dintre cele patru registre interne, dintre care trei corespund portului A, B și C, iar al patrulea registru este registrul de configurare De obicei, cele două linii de adresă sunt conectate la cei doi biți cei mai puțin semnificativi ai magistralei de adrese Linia de probă vă permite să construiți din interfețe RJ pe de biți interfețe cu o adâncime de biți mai mare, cu adăugarea de linii de adresă suplimentare și folosindu-le pentru a selecta interfața dorită prin setarea liniei de eșantionare a cipului Decodificarea adresei Până acum, nu ne-am oprit în detaliu asupra modului în care are loc alegerea unui cip de memorie sau a unui dispozitiv I/O Luați în considerare un computer încorporat simplu pe biți, constând dintr-o unitate centrală de procesare, o EPROM de K x octeți pentru stocarea programului, o memorie RAM de K x octeți pentru stocarea datelor și o interfață RIO Un astfel de sistem mic poate fi construit într-o jucărie ieftină sau într-un dispozitiv simplu După ce produsul intră în producție de masă, EEPROM-ul este înlocuit cu un ROM convențional Interfața PIO poate fi eșantionată într-unul din două moduri: cioturi de dispozitiv I/O sau ca parte a memoriei Dacă vom folosi RIO ca dispozitiv I/O, atunci trebuie să îl accesăm pe linia de magistrală corespunzătoare, ceea ce înseamnă că apelul ciotului este către dispozitivul I/O, nu către memorie O altă abordare se numește I/O mapat cu memorie Acest cip neglijent necesită octeți de memorie pentru a fi alocați celor trei porturi și registrului lringlgpia Alegerea noastră este oarecum arbitrară Luați în considerare I/O • maparea la memorie, deoarece această abordare ilustrează clar câteva probleme interesante de împerechere Memoria EPROM necesită KB de spațiu de adrese, RAM - de asemenea J KB t, Ryu - octeți Deoarece în exemplul nostru spațiul de adrese • Dacă conține K adrese, trebuie să alegem unde să plasăm cele trei proprietăți indicate Una dintre opțiunile posibile este prezentată în Fig , EPROM ocupă adrese de până la K, RAM - de la K la K, RYU - octeți mari ai adresei pro- • i rnіk gva, de la adresele la Din punctul de vedere al programatorului, nu contează, ink k* se adresează exact de folosit, dar pentru împerechere este de mare importanță Dacă ar fi să accesăm RIO prin spațiul I/O, am avea nevoie de adrese de memorie (dar am avea nevoie de patru adrese de memorie) • reguli de intrare-ieșire) EPROM de la adresa O RAM de la adresa H PIO de la adresa FFFCH eu Despre K K K K K K K K K K K K K K K K Orez , Locația EPROM, RAM și PIO într-un spațiu de K adrese Cu această alocare de adresă, EPROM-ul trebuie accesat utilizând adresa de memorie | -bit (în binar) În alte timpuri, orice adresă cu cei mai semnificativi cinci biți egali cu intră în pool-ul de memorie de până la K, adică în EPROM Astfel, semnalul de selectare EPROM poate fi conectat la un comparator de biți, care va avea întotdeauna una dintre intrările sale conectată la Același rezultat poate fi obținut mai eficient prin utilizarea unei porți SAU cu cinci intrări conectate la liniile de adresă de la Ai la Li Semnalul de ieșire poate fi dacă și numai dacă toate cele cinci iiiiii sunt În acest caz, semnalul CS este setat Această metodă de adresare este prezentată în Fig , a\ se numește decodare completă a adresei "Același principiu poate fi aplicat RAM Cu toate acestea, RAM trebuie să răspundă la adrese binare precum lOOOOxrxxrjtxxxxx, deci este nevoie de un invertor suplimentar (este prezentat în diagramă) Decodificarea adresei Ryu este oarecum mai complicată, deoarece este selectată folosind adrese precum Ixx () una dintre variantele posibile ale circuitului, care setează numai semnalul CS și în primul caz, dacă pe magistrala de adrese apare o adresă de acest tip, este afișată în Autobuz de adrese - - - - - - - - b Orez , Decodarea adresei complete (a); decodificarea parțială a adresei (b) figura Utilizează două porți NAND cu opt intrări care sunt conectate la o poartă SAU Dacă un computer constă doar dintr-un CPU, două cipuri de memorie și un PIO, decodarea adreselor este mult simplificată Faptul este că pentru toate adresele EPROM (și numai pentru EPROM) cel mai semnificativ bit al A este întotdeauna Sunt sigur că putem conecta pur și simplu semnalul CS la linia A(G(, așa cum se arată în Fig , ) Acum decizia de a aloca RAM de la adresa H nu pare atât de ușoară Rețineți că adrese precum ІОхххххххххххх sunt în RAM, deci doi biți sunt suficienți pentru codificare În mod similar, orice adresă care începe cu este o adresă PY Acum, logica completă de decodare constă din ambele invertoare Logica ilustrată în fig b, se numește decodare parțială a adreselor, deoarece în acest caz nu sunt folosite adrese complete Cu această decodare, citirea din adresele și De fapt, orice adresă din jumătatea inferioară a spațiului de adrese înseamnă o EPROM mai mare Deoarece nu sunt utilizate adrese suplimentare, acesta nu este un lucru groaznic, dar atunci când proiectați un computer care se așteaptă să se extindă în viitor (în cazul jucăriilor, acest lucru este puțin probabil), ar trebui evitată decodarea parțială, deoarece limitează semnificativ spatiu de adresare De asemenea, puteți utiliza o altă tehnologie de decodare a adreselor - folosind un decodor (vezi Figura ) Asociând trei intrări cu trei linii de adresă nivelul microarhitecturii Semnale de control al memoriei (rd, wr, fetch) Decodor cu intrari si iesiri MAR MDR OMBR D-NA RS SP CPP TOS OPC Anvelopa B MSB Memorie de control x biţi ■ pentru stocarea firmware-ului MIR JMPC Adr J ALU ( : m in JAMN/JAMZ F ALU f cu m th Autobuzul C N Z Flip-flop de bit Semnale de control Schema de schimburi H =TOS H = vârful stivei Ікз MDR \u d TOS \u d MDR -H; wr; goto Mâini Scădere; împingând rezultatul în vârful stivei EndiMAR=SP=SP- ; rd Citiți cuvântul de după cuvântul de sus al stivei Sfârşit? H = TOS H = partea de sus a stivei YniіZ MDR = TOS = MDR AND H; wr; mergeți la Mâini Operațiunea ȘI; împingând rezultatul în vârful stivei №ГІ MAR = SP = SP - ; rd Citiți cuvântul de după cuvântul de sus al stivei lor? H = TOS H = partea de sus a stivei Ior MDR = TOS = MDR SAU H; wr; dus la operațiunea Mâini OR; împingând rezultatul în vârful stivei dupl MAR = SP = SP + Creșteți SP cu și copiați rezultatul în registrul MAR (Iup MDR = TOS; wr; mergeți la Mâini Împingeți cuvântul nou în stivă popi MAR = SP = SP - ; rd Citiți cuvântul de după cuvântul de sus al stivei po|) Programul așteaptă în timp ce noua valoare a registrului TOS este citită din memorie pop TOS = MDR; goto Mâini Copiați cuvântul nou în registrul TOS Nwapl MAR = SP = SP - ; rd Setați registrul MAR la SP - ; citește al doilea cuvânt din stivă nwap MAR = SP Setați registrul MAR la cuvântul de sus al stivei mwap H=MDR; wr Stochează valoarea TOS în registrul H; împingând al doilea cuvânt în vârful stivei Nwap MDR = TOS Copiați valoarea TOS veche în registrul MDR Nwap MAR = SP - ; wr Setați registrul MAR la SP- ; împingând al doilea cuvânt pe stivă Nwap TOS=H; mergeți la actualizarea Mâini TOS bipushl SP = MAR = SP + MBR = octet care trebuie împins pe stivă continuare & wv i>"■■■ ■" /roven" microarhitectură Tabelul (continuare) Comentariu de operații de microcomandă bipush PC - PC + ; aducă Mărește PC-ul cu ; apel cod după operație bipush MDR=TOS=MBR; wr; goto Mâini Adăugați un bit suplimentar la octet și împingeți valoarea în stiva W iloadl H = LV MBR conține indice; copiați valoarea LV în H J iload MAR=MBRU+H; rd MAR = adresa variabilei locale care urmează să fie împinsă în stiva J ioacist MAR = SP = SP + Registrul SP indică noul top al stivei; pregătirea pentru înregistrarea J iload PC=PC+ ; aduce; wr Creșteți valoarea PC cu ; codul de apel al următoarei operații; stiva intrarea de sus iload TOS = MDR; du-te la Mâini Update TOS i istorel H = LV MBR conține indice; copiați valoarea LV în N istore MAR = MBRU + H MAR = adresa variabilei locale pentru a stoca cuvântul din stivă istore MDR=TOS; wr Copiați valoarea TOS în registrul MDR; introducerea de cuvinte istore SP=MAR=SP- ; rd Citiți din stivă al doilea cuvânt de sus store PC=PC+ ; aducă Mărește PC-ul cu ; apelați următorul cod operațional store TOS=MDR; mergeți la actualizarea Mâini TOS widel PC = PC + ; fetch Apelați byte-ul operandului sau codul următoarei operații wide goto(MBR SAU x ) Salt la nivel încrucișat la adrese mai înalte wide ialoadl PC = PC + ; fetch MBR conține primul octet al indexului; apel al doilea octet wide iload H = MBRU " H = primul octet index deplasat la stânga cu biți wide iload H=MBRU SAU H H = index variabil local pe biți wide iload MAR = LV + H; rd; goto iload MAR = adresa variabilei locale de împins în stivă wideistorel PC = PC + ; fetch MBR conține primul octet al indexului; apel al doilea octet Exemplu de implementare a microarhitecturii SOI Comentariu operațiuni Wlih' IMoi' u' este necesar doar pentru a adăuga H la MBRU în microinstrucțiunea iload Într-un design cu doi spini, nu există nicio modalitate de a adăuga doi |nh isteri arbitrari, așa că unul dintre ei trebuie mai întâi copiat în registrul H Într-o arhitectură cu magistrale, putem salva un ciclu, așa cum se arată în Tabelul Am adăugat bucla principală la comanda ILOAD, dar lungimea căii nu a crescut sau a scăzut Cu toate acestea, magistrala suplimentară reduce timpul total de execuție a instrucțiunii de la șase cicluri la cinci Acum cunoaștem a doua posibilitate de a termina lungimea căii: Trecerea de la arhitectura cu magistrale la magistrale Tabelul Firmware pentru executarea comenzii ILOAD într-o arhitectură cu magistrale Comentariu de operații de microcomandă lloadl MAR = MBRU + LV; rd MAR = adresa variabilei locale care urmează să fie împinsă în stivă І оас MAR = SP = SP + Iioa PC = PC + ; aduce; wr Mărește PC-ul cu ; apelarea următorului cod operațional; scriind partea de sus a stivei Iload TOS = MDR Update TOS lload PC=PC+ ; aduce; goto(MBR) MBR-ul conține deja opcode; numim octetul index Bloc de preluare a comenzii Ambele posibilități descrise sunt destul de aplicabile, dar este necesar ceva mai radical pentru a obține un efect semnificativ Să ne întoarcem puțin și să ne uităm la ingredientele obișnuite ale oricărei comenzi: preluarea și decodarea câmpurilor* Rețineți că următoarele operații pot avea loc în fiecare comandă + Valoarea PC este trecută prin ALU și incrementată cu ; + RS este folosit pentru a apela următorul octet din fluxul de comandă; + operanzii sunt cititi din memorie; + operanzii sunt scrieți în memorie; + ALU efectuează calculul și rezultatele sunt stocate în memorie Dacă instrucțiunea conține câmpuri suplimentare (pentru operanzi), fiecare câmp trebuie apelat în mod explicit, câte un octet Câmpul poate fi utilizat numai după ce acești octeți au fost concatenați La preluarea și reasamblarea unui câmp, ALU trebuie să mărească PC-ul cu unul pentru fiecare octet și apoi să concateneze indexul sau offset-ul rezultat Atunci când, pe lângă realizarea lucrării principale a unei instrucțiuni, este necesar să apelați și să combinați câmpurile acestei instrucțiuni, ALU este utilizat în aproape fiecare ciclu Pentru a combina bucla principală cu unele microinstrucțiuni, trebuie să eliberați ALU de unele dintre aceste sarcini Un al doilea ALU poate fi introdus pentru aceasta, deși un ALU complet funcțional nu este necesar în majoritatea cazurilor Rețineți că ALU este adesea folosit pentru a copia o valoare dintr-un registru în altul Aceste bucle pot fi eliminate prin introducerea de căi de date suplimentare care nu trec prin ALU Ar fi util, de exemplu, să creați o cale de la TOS la MDR sau de la MDR la TOS, deoarece cuvântul de sus al stivei este adesea copiat dintr-un registru în altul În microarhitectura Mis- , cea mai mare parte a încărcăturii poate fi eliminată din ALU dacă este creat un bloc independent pentru a apela și procesa comenzi Această unitate, numită Instruction Fetch Unit (IFU), poate incrementa PC-ul cu unul independent de ALU și poate prelua octeți din fluxul de octeți înainte de a fi necesari IFU conține un circuit de incrementare care este mult mai simplu în design decât un adunator complet Să dezvoltăm această idee Instrucțiunea fetch id poate, de asemenea, combina șiruri fetch de și biți, astfel încât acestea să poată fi utilizate de îndată ce sunt necesare Acest •inFiio se poate face în cel puţin două moduri: ♦ Inok IFU poate interpreta fiecare cod operațional, poate determina câte câmpuri suplimentare să apeleze și le poate asambla într-un registru pentru a fi utilizat de codul operațional principal ♦ Ceasul IFU poate furniza continuu următoarele bucăți de date de sau biți, indiferent dacă are sens sau nu Unitatea de operare principală poate solicita apoi orice date de care are nevoie O implementare rudimentară a celei de-a doua metode este prezentată în fig În loc de іі/ііініo MBR pe biți, există două MBR-uri: MBR pe biți și MBR pe biți IFU ține evidența celui mai recent octet în octeți care au intrat în unitatea de operare principală În plus, mp transferă următorul octet în registrul MBR, ca și în arhitectura Mic- , doar în cazul opus determină automat când se citește valoarea registrului, acum următorul octet și îl încarcă imediat în registrul MBR Ca și în microarhitectura Mis- , are două interfețe cu magistrala B: MBR și MBR U Primul primește o extensie de semn la de biți, al doilea este umplut cu zerouri MBR Înscriere în Registrul RS Orez Blocul de preluare a comenzii în microarhitectura Mіs- Registrul MBR funcționează exact la fel, dar conține următorii octeți ()n are două interfețe cu magistrala B: MBR și MBR U, prima dintre acestea fiind extinsă cu semn, iar a doua este zero-padded la de biți Blocul de instrucțiuni de preluare este responsabil pentru preluarea fluxului de octeți Pentru a face acest lucru, folosește portul de memorie standard de octeți, apelând cuvintele trans de octeți și încărcând următorii octeți în registrul de deplasare, care le scoate idiom sau doi la un moment dat, în ordinea în care sunt preluați din memorie Sarcina registrului de deplasare este de a stoca secvența de octeți de intrare pentru încărcare în registrele MBR și MBR MBR conține întotdeauna cel mai semnificativ octet al registrului de deplasare, iar MBR octeți înalți (cel mai mare este octetul din stânga), care formează un număr întreg de rânduri (vezi Fig , b) Doi octeți din registrul MBR ar putea și derivate din cuvinte diferite de memorie deoarece comenzile IJVM nu sunt legate în niciun fel de limitele cuvintelor Ori de câte ori este citit registrul MBR , valoarea registrului de deplasare este deplasată la dreapta cu octet Când MBR este citit, valoarea registrului de deplasare este deplasată la dreapta cu octeți Apoi registrele MBR și MNU sunt încărcate cu octetul cel mai semnificativ și, respectiv, cu perechea de octeți cei mai semnificativi Dacă în acest moment există suficient spațiu dm și un cuvânt întreg rămas în registrul de deplasare, unitatea de preluare a instrucțiunii începe un ciclu de acces la memorie pentru a citi cuvântul următor Se presupune că atunci când citiți oricare dintre șirurile rsg MBR, acesta este reumplut până la începutul următorului ciclu, astfel încât noua valoare poate fi citită deja în ciclurile următoare Blocul de preluare a instrucțiunilor poate fi modelat ca o mașină cu stări finite (FSM), așa cum se arată în Fig Orice automat finit este caracterizat de stări (acestea sunt cercuri din figură) și tranziții (acestea sunt arce de la o stare la alta) Fiecare stare este una dintre situațiile posibile în care se poate afla mașina de stări Această mașină de stări are șapte stări, care corespund celor șapte stări ale registrului de deplasare prezentat în Fig Aceste șapte stări corespund! numărul de octeți care se află în prezent în registru (de la la inclusiv) Tranziții MBR : Apare când MBR este citit MBR : Apare la citirea MBR Apel de cuvânt: apare atunci când un cuvânt este citit din memorie și octeți sunt plasați în registrul de deplasare Orez Mașină de stări pentru implementarea blocului de preluare a instrucțiunilor Fiecare arc reprezintă un eveniment posibil Există trei evenimente diferite posibile în mașina noastră cu stări finite Primul este de a citi un octet din registrul MBR Activează registrul de deplasare, octetul cel mai din dreapta din acesta dispare și se face o tranziție la o altă stare (mai puțin de ) Al doilea eveniment citește octeți din registrul MBR În acest caz, se face o tranziție la o stare mai mică decât (de exemplu, de la starea la starea sau de la inнііііi ii stare ) Ambele aceste tranziții fac ca registrele MNI I n MBR să fie reîncărcate Când mașina de stări trece la stările , sau , ini-piprug I accesează memoria pentru a apela un cuvânt nou (presupunând că nu este deja ocupat să citească cuvântul anterior) Când sosește cuvântul, nmi p al stării crește cu "Dacă schema de preluare a instrucțiunilor trebuie să funcționeze corect, trebuie și trebuie să fie setată dacă este necesar să efectueze o acțiune pe care nu o poate sări (de exemplu, transferați o valoare la MBR când există doar octet în registrul i/img ) , iar memoria este încă ocupată de chemarea acestui cuvânt) În plus, un colector de comandă nu poate executa mai multe 'ііііііііingіing' în același timp, așa că toate evenimentele primite trebuie să fie transmise la iun 'іііііііоіu În cele din urmă, de fiecare dată când computerul se schimbă, blocul de preluare a instrucțiunilor este actualizat Toate aceste detalii complică munca blocului Cu toate acestea, multe jocuri sunt concepute ca mașini de stat Іі/юк instruction fetch are propriul registru de adrese de memorie, IMAR și este folosit pentru a accesa memorie atunci când aveți nevoie să-nіііііі lume noua Acest registru are o schemă specială de creștere, deci • iar ALU ionic nu trebuie să adauge unul la valoarea PC pentru a apela cuvântul unic Unitatea de preluare a instrucțiunilor trebuie să monitorizeze magistrala C, astfel încât de fiecare dată când registrul PC este încărcat, noua valoare a PC-ului să fie copiată și în IMAR Deoarece noua valoare din registrul RS poate să nu fie la graniță • iiiiiiiii, aducătorul de instrucțiuni trebuie să recupereze cuvântul dorit și să ajusteze nepotrivirile registrului de deplasare în consecință ( h un bloc operativ nou scrie o valoare pe computer numai dacă i și i trebuie să schimbăm caracterul secvenței de octeți Acest lucru se întâmplă în instrucțiunea de salt, precum și în instrucțiunile INVOKEVIRTUAL și IRETURN Deoarece firmware-ul nu mai incrementează în mod explicit computerul pe opcode iii i iovg, unitatea de preluare a instrucțiunilor trebuie să actualizeze computerul însuși Cum se întâmplă asta? IFU este capabil să recunoască faptul că a fost primit un octet din fluxul de instrucțiuni, adică valorile registrelor MBR și MBR (sau variantele lor nesemnate) au fost deja citite O schemă de incrementare separată este asociată cu registrul PC, care crește numărul cu sau , în funcție de câți octeți sunt primiți Astfel, registrul PC conține întotdeauna adresa primului octet neprimit încă La începutul fiecărei instrucțiuni, registrul MBR conține adresa codului operațional al instrucțiunii () Rețineți că există două scheme de creștere diferite care îndeplinesc trei funcții diferite Registrul PC numără octeții și incrementează valoarea cu sau Registrul IMAR numără cuvintele și incrementează valoarea doar cu (pentru patru octeți noi) La fel ca MAR, registrul IMAR este conectat la linia de adresă "dar în diagonală": bitul al registrului IMAR este conectat la linia de adresă , și așa mai departe, pentru a efectua un salt implicit de la o adresă de cuvânt la o adresă de octet Vom vedea în curând că, dacă nu este nevoie să creștem valoarea PC-ului în bucla principală, acesta este un câștig mare, deoarece de obicei nu se întâmplă nimic altceva în microinstrucțiunea în care are loc creșterea PC-ului Dacă această comandă este eliminată, lungimea căii va fi redusă Cu toate acestea, pentru a crește viteza mașinii, este nevoie de mai mult hardware Astfel, am ajuns la a treia posibilitate de a scurta lungimea căii: Preluarea comenzilor din memorie este efectuată de un bloc funcțional specializat / Preluare comenzi din memorie - Microarhitectura Mis- Blocul de preluare a instrucțiunilor poate reduce semnificativ lungimea căii pentru instrucțiunile dintre II În primul rând, elimină complet bucla principală, deoarece cavalerii fiecărei comenzi pur și simplu sar la următoarea deodată În al doilea rând, ALU nu trebuie să crească valoarea PC-ului În al treilea rând, IFU trunchiază lungimea zero și ori de câte ori se calculează un index de biți sau un offset, înmіb Orez Calea datelor pentru MIS- IV captează o valoare de biți și transmite imediat la ALU ca valoare de de biți fără a fi nevoie să se concateneze în registrul II II fig Figura prezintă microarhitectura Mis- , o versiune îmbunătățită a Mii I, la care unitatea de preluare a comenzii prezentată în fig Firmware-ul pentru mașina îmbunătățită este prezentat în tabel Am "blitz Firmware pentru MIS- Comentariu de operații de microcomandă Port goto (MBR) Treceți la următoarea comandă hulii MAR = SP = SP - ; rd Citiți cuvântul de după cuvântul de sus al stivei huli H = TOS H = partea de sus a stivei huli , MDR = TOS = MDR + H; wr; goto (MBR ) Însumarea primelor două cuvinte; scriind suma în poziția de sus a stivei huli MAR=SP=SP- ; rd Citiți cuvântul de după cuvântul de sus al stivei | ul"ZH = TOS H = vârful stivei hnl> MDR = TOS = MDR - H; wr; goto (MBR ) Scădeți TOS din valoarea numită TOS - lutul MAR = SP = SP - ; rd Citiți cuvântul de după cuvântul de sus al stivei ІІНПІ H = TOS H = partea de sus a stivei Ipiniz MDR = TOS = MDR AND H; wr; goto (MBR ) Înmulțirea booleană a valorii numite TOS este și TOS (operație AND) lori MAR=SP=SP- ; rd Citiți cuvântul de după cuvântul de sus al stivei lot H = TOS H = partea de sus a stivei h >r MDR = TOS = MDR SAU H; wr; goto (MBR ) Adăugarea booleană a valorii numite TOS - și TOS (operație OR) (lupi MAR = SP = SP + Incrementați SP cu și copiați rezultatul în registrul MAR ilup MDR=TOS; wr; goto (MBR ) Împingeți un cuvânt nou pe stivă popi MAR = SP = SP - ; rd Citiți cuvântul de după cuvântul de sus al stivei pop Programul așteaptă finalizarea procesului de citire |n>p TOS = MDR; goto (MBR ) Copiați cuvântul nou în registrul TOS swapl MAR = SP - ; rd Citiți al doilea cuvânt din stivă; setarea registrului MAR la SP continuare & Tabelul (continuare) Comentariu de operații de microcomandă swap MAR = SP Se pregătește pentru a scrie un nou al doilea cuvânt de stivă swap H = MDR; wr Salvați noua valoare TOS; scriind al doilea cuvânt al stivei swap MDR = TOS Copiați valoarea TOS anterioară în registrul MDR swap MAR = SP - ; wr Scrieți valoarea anterioară a TOS în a doua poziție din stivă swap TOS=H; goto (MBR ) Actualizați TOS bipushl SP = MAR = SP + Setați registrul MAR să scrie într-un nou vârf al stivei I)ipush MDR = TOS = MBR ; wr; goto (MBR ) Actualizați stiva în registrul și memoria TOS iload MAR = LV + MBR U; rd Mută valoarea LV cu indice în registrul MAR; citește operand iload MAR = SP = SP + Mărește SP cu ; mutați noua valoare SP în registrul MAR iload TOS = MDR; wr; goto (MBR ) Actualizați stiva în registrul și memoria TOS istorel MAR = LV + MBR U Setați registrul MAR la LV + index istore MDR=TOS; wr Copiați valoarea TOS pentru a o stoca în memorie istore MAR=SP=SP- ; a rd Scăderea SP cu ; citind noua valoare TOS istore Aparatul așteaptă sfârșitul procesului de citire store TOS=MDR; goto (MBR ) Actualizați TOS widel goto (MBR SAU x ) Următoarea adresă este x SAU opcode wideloadl MAR = LV + MBR U; rd; goto iload La fel ca iload , dar folosind un index de octeți wideistorel MAR=LV+MBR U; goto istore La fel ca istorel, dar folosind un index de octeți Idcwl MAR = CPP + MBR U; rd; goto iload La fel ca iloadl wide, dar indexat din registrul CPP ii ne MAR = LV + MBR U; rd Setați registrul MAR la LV + index; citind această valoare Comentariu operațiunilor Mimro-Nmanda Ніи H - MBR Atribuirea unei constante pentru înregistrarea H ihu MDR " MDR + H; wr; goto (MBR ) Creștere prin constantă și actualizare CіНнІ H = PC - Copiați valoarea PC pentru a înregistra H cnip PC = H + MBR Adăugați offset și actualizați computerul CnInZ Aparatul așteaptă ca blocul de preluare a instrucțiunilor să apeleze un nou cod operațional cnio goto (MBR ) Treceți la următoarea comandă іікі MAR = SP = SP - ; rd Citiți al doilea cuvânt din partea de sus a stivei KII OPC = TOS Stocare temporară a TOS în OPC nіі h TOS = MDR Scrieți un nou stivă de sus în TOS IIIU N=OPC; dacă(N) a ajuns la T; altfel mergi la F Sari pe bit N Și"h| MAR = SP = SP - ; rd Citiți al doilea cuvânt din partea de sus a stivei ІІні| OPC = TOS Stocarea temporară a TOS în OPC ІІіч| TOS = MDR Scrieți un nou stivă de sus în TOS Z=OPC; dacă(Z) a ajuns la T; altfel mergi la F Sari pe bit Z Și icmpeql MAR = SP = SP - ; rd Citiți al doilea cuvânt din partea de sus a stivei II I( inpeq MAR = SP = SP - Setați registrul MAR pentru a citi noul vârf al stivei II la inpcq H = MDR; rd Copiați al doilea cuvânt din stivă în înregistrarea H ІІ |cmpcq OPC = TOS Stocarea temporară a TOS în OPC Și Hinpeqo TOS = MDR Punerea unui nou stivă în TOS Și icinpeq Z = H - OPC; dacă(Z) a ajuns la T; else goto F Dacă primele două cuvinte sunt egale, sari la T; dacă nu sunt egale, mergeți la F Г H = PC - ; goto goto La fel ca gotol H = MBR Ignorați octeții în MBR F merge la (MBR ) Invokevirtual MAR = CPP + MBR U; rd Introduceți adresa pointerului procedurii în registrul MAR în vokcvirtual OPC = PC Stochează valoarea PC în registrul OPC continuare & Tabelul (continuare) Comentariu de operații de microcomandă invokevirtua! PC = MDR Setați PC-ul la primul octet al codului de procedură invokevirtual TOS=SP-MBR U TOS=adresă OBJREF - invokevirtua! TOS=MAR=H=TOS+ TOS=OBJREF adresa invokcvirtual MDR = SP + MBR U + ; wr Suprascrieți OBJREF cu indicatorul de legătură invokevirtual MAR = SP = MDR Setați registrele SP și MAR la adresa celulei care conține vechea valoare PC invokevirtua! MDR = OPC; wr Se pregătește pentru salvarea vechii valori a PC-ului invokevirtual MAR = SP = SP + Mărește SP cu ; acum SP indică celula în care este stocată vechea valoare LV invokevirtualO MDR = LV; wr Salvați valoarea LV veche invoca virtual LV=TOS; goto (MBR ) Setați valoarea LV la parametrul nul ireturnl MAR=SP=LV; rd Resetează registrele SP și MAR pentru a citi indicatorul de legătură ireturn Procesul de citire a indicatorului de legătură ireturn LV=MAR=MDR; rd Setați registrele LV și MAR pentru a lega pointerul; citind vechea valoare a RS ireturn MAR = LV + Setați registrul MAR la vechea valoare a LV; citirea valorii LV vechi ireturn PC - MDR; a doua recuperare PC ireturn MAR=SP ireturn LV = MDR LV Recovery ireturn MDR=TOS; wr; goto (MBR ) Stocați rezultatul în partea de sus inițială a stivei Pentru a demonstra cum funcționează Mis- , luați în considerare comanda IADD Scoate al doilea cuvânt din stivă și efectuează adăugarea ca înainte, doar că acum nu mai trebuie să sară la Mâini după finalizarea operației pentru a crește valoarea PC și a trece la următoarea microinstrucțiune Când unitatea de preluare a instrucțiunilor recunoaște că MBR a fost accesat în bucla iadd , registrul său intern de deplasare mută totul spre dreapta și resetează tsіѵzhiіісі MBR și MBR De asemenea, trece la o stare care este cu unul mai puțin decât cea actuală Dacă noua stare este starea , blocul de comandă you-unrcp începe să reamintească cuvântul din memorie Toate acestea sunt implementate în hardware Firmware-ul nu trebuie să facă nimic De aceea comanda IADO poate fi cheltuită de la patru până la trei micro-instrucțiuni În microarhitectura Mis- , unele comenzi sunt îmbunătățite într-o măsură mai mare decât altele Instrucțiunea LDC w este redusă de la la microinstrucțiuni și, i Invariabil, timpul de executare a comenzii este redus cu un factor de trei Pe de altă parte, comanda SWAP conținea inițial micro-comenzi, dar acum a devenit Pentru performanța generală a computerului, reducerea comenzilor repetate cel mai frecvent joacă un rol, iar acestea sunt comenzile ILOAD (era , acum ), iadd (era , acum ) ii II ICMPEQ (a fost , a devenit pentru cazul când cuvintele sunt egale; a fost , a devenit '/Nіi caz când cuvintele nu sunt egale) Evaluarea comparativă a performanței sistemului poate fi utilizată pentru a calcula cât de mult s-a îmbunătățit performanța, dar este clar că există un câștig semnificativ de performanță Design transportor - microarhitectura Mis- Evident, microarhitectura lui Mis- este mai perfectă decât Mis- Funcționează mai bine și necesită mai puțină memorie de control, deși costul unității de preluare a instrucțiunilor depășește fără îndoială suma câștigată prin reducerea cantității de memorie de control Astfel, mașina Mis- funcționează mult mai bine - • irg cu o oarecare creștere a costurilor Să vedem dacă Gnmiype mai poate crește viteza Dar dacă încercați să reduceți timpul ciclului? În mare măsură, timpul ciclului este determinat de tehnologia de bază Cu cât tranzistoarele și distanța fizică dintre ele sunt mai mici, cu atât mai rapid poate funcționa integratorul principal În tehnologia pe care o luăm în considerare, timpul necesar călătoriei prin calea datelor este fix (cel puțin din punctul nostru de vedere) Cu toate acestea, avem o oarecare libertate de acțiune și apoi o vom folosi la maximum O altă opțiune de îmbunătățire este creșterea gradului de paralelism În prezent, microarhitectura Mis- realizează cele mai multe operațiuni secvenţial Pune valorile registrului pe autobuze, așteaptă ca ALU și comutatorul să le proceseze, apoi scrie rezultatele înapoi în registre Dacă nu țineți cont de funcționarea blocului de preluare a instrucțiunilor, aici nu există paralelism Introducerea unor mecanisme suplimentare pentru procesarea paralelă promite beneficii semnificative După cum sa menționat deja, timpul ciclului este determinat de timpul necesar pentru ca semnalul să treacă prin calea datelor Pe fig Figura prezintă distribuția acestei întârzieri între diferitele componente în timpul fiecărui ciclu Ciclul căii de date are trei componente principale: Timpul necesar pentru a transfera valorile registrelor selectate către magistralele A și B Timpul necesar pentru funcționarea ALU și a circuitului de schimbare Timpul necesar pentru a transfera valorile primite înapoi în registre și pentru a stoca aceste valori Pe fig Figura prezintă noua arhitectură cu magistrale cu o unitate de preluare a instrucțiunilor și trei zăvoare suplimentare (registre), fiecare situat în mijlocul fiecărei magistrale Aceste registre sunt scrise în fiecare ciclu și împart calea datelor în părți separate care pot funcționa independent unele de altele Vom numi o astfel de arhitectură modelul conductei, sau Mis- Orez Calea datelor cu trei autobuze în microarhitectura Mіs- Dezvoltare la nivel de microarhitectură •kv mFiecare cm are nevoie de trei registre suplimentare? La urma urmei, acum este nevoie de cicluri pentru a trece semnalul prin calea de date: unul pentru a încărca Iristrov A și B, al doilea pentru a porni ALU și circuitul de schimbare, precum și pentru a încărca Vostra C, al treilea pentru a salva valoarea de registrul de blocare C înapoi la nevoie -■-le de registre Suntem anormali? {Sugestie', nu ) Există o zi întreagă în care ■CHI și s introduc registre suplimentare: ■ Putem mări viteza ceasului deoarece întârzierea maximă P este acum mai mică K În timpul fiecărui ciclu, putem folosi toate părțile căii de date b După împărțirea căii de date în trei părți, întârzierea maximă de propagare a semnalului este redusă, ca urmare, frecvența ceasului poate fi mărită Considerăm că dacă rupeți ciclul căii de date în trei |Nr Opt instrucțiuni IJVM necesită o ramură condiționată, care este preluată de al n-lea bit N Când apare o astfel de ramură, conducta nu poate continua De aceea a trebuit să adăugăm un bit re-Ivj la micro-op Când un micro-op cu acest bit ajunge la blocul de așteptare, |doc se abține de la a semnala primirea datelor către blocul decode-Im * Ca rezultat , mașina este inactivă până când această tranziție este rezolvată '■ Probabil, unele instrucțiuni IJVM care nu depind de această tranziție ar putea fi deja transmise blocului de decodare, dar nu și cozii de așteptare, deoarece nu a semnalat încă primirea Pentru a rezolva această confuzie și a reveni la funcționarea normală necesită un dispozitiv special și mecanisme speciale, dar nu le vom lua în considerare în această carte Aici observăm doar că Edgar Dijkstra, care a scris celebrul manifest Despre perniciozitatea comenzilor goto, avea cu siguranță dreptate [Dijkstra, a] Am început cu microarhitectura Mis- și, după ce am parcurs un drum lung, am ajuns la microarhitectura Mis- Hardware-ul microarhitecturii Mis- s-a dovedit a fi foarte simplu, deoarece aproape tot controlul a fost |>salizat în software Microarhitectura Mis- este o structură pipeline cu șapte etape și hardware mai complex Acest transportor este prezentat în Fig Numerele din cercuri corespund Componentelor din fig În microarhitectura Mis- , un flux de octeți este extras automat din memorie în avans, decodificat în comenzi IJVM, care sunt apoi convertite într-o secvență de operații folosind ROM și aplicate conform intenției Primele trei etape ale conductei, dacă se dorește, pot fi asociate cu generatorul principal al căii de date, dar munca nu va avea loc în fiecare ciclu De exemplu, instrucțiunile de preluare cu siguranță nu ar putea trimite un nou opcode către decodor în fiecare ciclu, deoarece instrucțiunea IJVM durează mai multe cicluri pentru a fi executată și coada se va umple rapid Orez Transportor Mis- Bloc de preluare a comenzii la Capitolul Stratul de microarhitectură În fiecare ciclu, valorile registrelor MIR sunt deplasate, iar micro-ul din capul cozii este copiat în registrul MIRI Semnalele de control de la toate cele patru MIR-uri sunt apoi transmise de-a lungul căii de date, provocând acțiuni specifice Fiecare MIR controlează o parte diferită a căii de date și, prin urmare, micropași diferiți Această arhitectură folosește un procesor pipeline, ceea ce face ca pașii individuali să fie foarte scurti și viteza de ceas mare Multe procesoare sunt proiectate astfel, în special cele care trebuie să execute setul de instrucțiuni legacy (CISC) De exemplu, implementarea Coget I este similară în unele privințe cu microarhitectura Mic- , așa cum vom vedea mai târziu în acest capitol Creșterea productivității Toți producătorii de computere doresc ca sistemele lor să funcționeze cât mai repede posibil În această secțiune, vom analiza o serie de tehnologii avansate de performanță a sistemului (în primul rând CPU și memorie) care sunt în prezent cercetate Întrucât concurența în industria calculatoarelor este foarte intensă, de obicei există foarte puțin timp între apariția unei noi idei de creștere a vitezei unui computer și punerea în aplicare a acestei idei Prin urmare, majoritatea ideilor pe care le vom discuta acum, cel mai probabil, sunt deja aplicate în producție Îmbunătățirile luate în considerare pot fi împărțite în două categorii în ceea ce privește implementarea și arhitectura Îmbunătățirile de implementare sunt modalități de a construi un nou procesor și memorie care fac sistemul să ruleze mai rapid fără a schimba arhitectura Schimbarea implementării fără modificarea arhitecturii înseamnă că software-ul vechi va putea rula pe noua mașină, ceea ce este esențial pentru o vânzare de succes Pentru a îmbunătăți implementarea, puteți, de exemplu, să utilizați un generator master mai rapid, dar aceasta nu este singura modalitate Rețineți că creșterea performanței de la procesorul la , Pentium și modelele ulterioare (cum ar fi Core i ) a fost realizată prin îmbunătățirea implementării, în timp ce arhitectura în ansamblu a rămas neschimbată Cu toate acestea, unele îmbunătățiri pot fi realizate doar prin schimbarea arhitecturii Uneori, de exemplu, trebuie să adăugați instrucțiuni sau registre noi și în așa fel încât programele învechite să poată funcționa pe modele noi În acest caz, pentru a obține performanțe maxime, software-ul trebuie să fie reproiectat sau cel puțin procesat cu un nou compilator pentru a profita de noile funcții Cu toate acestea, o dată la câteva decenii, dezvoltatorii realizează că vechea arhitectură nu mai este bună pentru nimic și singura modalitate de a dezvolta tehnologii în continuare este să o ia de la capăt Apariția arhitecturii RISC în anii a fost un salt atât de revoluționar, iar acum următoarea descoperire se apropie Ne vom uita la un exemplu înrudit (Intel IA- ) în Capitolul Mai târziu în această secțiune, vom acoperi patru tehnici pentru îmbunătățirea performanței procesorului Să începem cu trei bine stabilite Creșterea productivității Îmbunătățiri Enton la implementare, iar apoi treceți la varianta, tre-gmu îmbunătățiri minore în arhitectură Aceste tehnici includ memoria cache, predicția ramurilor, execuția de redimensionare și schimbul de registre și execuția speculativă -memorie Unul dintre cele mai importante aspecte ale proiectării computerelor a fost și este încă, proiectarea unui sistem de memorie care permite ca operanzii să fie transferați la procesor în aceeași rată cu care îi procesează Creșterea rapidă a performanței procesorului, din păcate, nu este însoțită de o creștere la fel de rapidă a vitezei memoriei Față de procesor, acesta devine din ce în ce mai lent Având în vedere importanța extremă a memoriei, această situație, care se deteriorează în fiecare an, împiedică serios dezvoltarea sistemelor de înaltă performanță, forțând dezvoltatorii J&KU și soluțiile alternative * Procesoarele moderne impun anumite cerințe asupra sistemului Limit și în ceea ce privește latența (întârziere în livrarea operandului), și în ceea ce privește lățimea de bandă (cantitatea de date transferate pe unitatea de timp) Din păcate, aceste două aspecte ale sistemului de memorie sunt în mare măsură inconsecvente De obicei, pe măsură ce debitul crește, Latența crește De exemplu, tehnologiile pipeline pe care le-am folosit în microarhitectura Mis- pot fi aplicate și sistemului de memorie, caz în care transferurile de memorie vor fi procesate mai rațional, cu suprapunere Cu toate acestea, din păcate, ca și în microarhitectura Mis- , acest lucru duce la o creștere a timpului de așteptare pentru operațiunile individuale de memorie Pe măsură ce viteza oscilatorului crește, devine din ce în ce mai dificilă menținerea unui sistem de memorie care poate transfera operanzi în unul sau două cicluri O soluție la problemă este adăugarea memoriei cache După cum am observat în secțiunea "Cache" a secțiunii "Memorie principală" a capitolului , cuvintele cele mai frecvent utilizate sunt stocate în memoria cache, accelerând astfel accesul la ele Dacă un procent suficient de mare din cuvintele dorite se află în cache, timpul de așteptare poate fi redus semnificativ Una dintre cele mai eficiente tehnici pentru creșterea debitului și reducerea latenței în același timp este utilizarea mai multor blocuri cache Tehnica principală este introducerea unor cache separate pentru comenzi și date (așa-numita memorie cache partajată) Un astfel de cache are mai multe avantaje, în special, operațiunile pot începe independent în fiecare cache, ceea ce dublează debitul sistemului de memorie Din acest motiv, în microarhitectura Mis- aveam nevoie de două porturi de memorie separate: un port separat pentru fiecare cache Rețineți că fiecare cache are acces independent la memoria principală În zilele noastre, multe sisteme de memorie sunt mult mai complexe decât acestea Cache-ul L este adesea plasat între memoria cache partajată și memoria principală În general, pe măsură ce cerințele de memorie cresc, numărul de niveluri de cache poate ajunge la trei sau mai mult Pe fig Figura prezintă un sistem cu trei niveluri de cache Direct pe cipul CPU Ilam f nivelul microarhitecturii există un mic cache pentru instrucțiuni (LI-I) și un mic cache pentru date (L -D), de obicei de la la KB Există, de asemenea, o memorie cache de nivel al doilea (E ), care se află nu pe cipul procesorului în sine, ci lângă ea în acel bloc ZhG Cache-ul L este conectat la procesor printr-o cale de date de mare viteză Acest cache nu este de obicei partiționat și reține date și instrucțiuni împreună Dimensiunea sa este de la KB la MB Cache-ul L se află pe aceeași placă ca și procesorul și constă de obicei din câțiva megaocteți de RAM statică, care este mult mai rapidă decât memoria principală DRAM De obicei, întregul conținut* al cache-ului L se află în cache-ul L , iar întregul conținut al cache-ului L se află în cache-ul L Cadru procesor Cip de procesor Cache L partiționat Placa procesorului Cache L pentru instrucțiuni Cache primul nivel pentru date Cache L consolidat Cache L unificat Memoria principală (RAM dinamică) Controler cu tastatură Controler grafic Controler de disc Memoria cache pe placa procesorului (RAM statică) Orez Sistem cu trei niveluri de cache Există două opțiuni pentru localizarea adresei, de care depinde funcționarea memoriei cache Localizarea spațială se bazează pe probabilitatea ca în viitorul apropiat să fie nevoie de acces la celulele de memorie situate lângă celulele numite recent Pe baza acestei observații, în cache sunt transferate mai multe date decât este necesar în prezent Localizarea temporală are loc atunci când celulele apelate recent sunt solicitate din nou Acest lucru se poate întâmpla, de exemplu, cu celulele de memorie din partea de sus a stivei sau cu instrucțiuni în interiorul unei bucle Principiul localizării temporale este folosit pentru a selecta elementele care ar trebui eliminate din cache în cazul unei pierderi de cache De obicei, acele elemente care nu au fost accesate de mult timp sunt șterse Toate tipurile de cache folosesc următorul model Memoria principală este împărțită în blocuri de dimensiuni fixe numite șiruri Creșterea productivității M O linie cache I constă din mai mulți octeți consecutivi (de obicei de la I) Liniile sunt numerotate începând de la , adică dacă dimensiunea liniei este unu, atunci linia este octeții de la la , linia este octeții de la la etc Există mai multe linii în cache în acest moment Când are loc o atingere de memorie, controlerul cache verifică dacă există cuvântul de memorie dorit Dacă există un cuvânt (cazul unei lovituri în cache), atunci puteți salva accesul necesar la memoria principală Dacă cuvântul dat se află în memoria cache (learn cache miss), atunci una dintre liniile din cache este ștearsă și, în schimb, linia solicitată din memoria principală sau din memoria cache este plasată acolo cu un nivel mai mare de ' Există multe variante ale acestei scheme, dar se bazează pe ideea de a păstra în cache cât mai multe *roci utilizate frecvent, astfel încât numărul de accesări în cache să fie maximizat Ivsh - Memorie mapată directă Cel mai simplu tip de cache este un cache mapat direct Un exemplu de cache mapat direct DLC este prezentat în Fig , a Această memorie conține de elemente Fiecare element (rând) poate deține {OVNO un termen din memoria principală Dacă dimensiunea liniei de cache este de octeți (ca în acest exemplu), memoria cache poate conține KB Fiecare memorie cache a lui Lems constă din trei părți: + Bitul de validitate indică dacă există sau nu date valide în element Când sistemul pornește, toate elementele sunt marcate ca nevalide Pic Biți Tag String Word Byte b Orez Cache de cartografiere directă (a); Adresă virtuală pe de biți (b) Capitolul Stratul de microarhitectură + Câmpul de etichetă constă dintr-o valoare unică de biți, indicând linia corespunzătoare de memorie din care provin datele + Câmpul de date conține o copie a datelor de memorie Acest câmp conține o linie cache OJ de de octeți În memoria cache mapată direct, un anumit cuvânt poate fi stocat doar într-un singur loc Dacă nu este în acest loc, atunci nu este deloc în cache Pentru a stoca date în cache și a le prelua din cache, adresa este împărțită în componente, așa cum se arată în Fig b: + Câmpul de etichetă corespunde biților stocați în câmpul de etichetă al elementului QEC de indentare + I Іole al liniei indică ce element de cache conține * corespunzător date, dacă acestea există în cache + Câmpul cuvânt indică ce cuvânt din șir este referit + Câmpul octet nu este utilizat în mod normal, dar dacă este necesar doar un octet, acest câmp indică exact ce octet din cuvânt este necesar Pentru o memorie cache care acceptă numai cuvinte pe de biți, acest câmp conține întotdeauna Oe* Când CPU emite o adresă de memorie, hardware-ul alocă biți din câmpul șir de la acea adresă și îi folosește pentru a căuta una dintre cele de intrări din cache Dacă elementul este valid, atunci se face o comparație între câmpul etichetei de memorie principală și câmpul etichetei cache Dacă câmpurile sunt egale, atunci memoria cache conține cuvântul solicitat Această situație se numește hit cache În cazul unei lovituri în cache, cuvântul este preluat direct din cache și apoi nu este nevoie să accesați memoria principală Din elementul cache este luat doar cuvântul dorit, restul elementului nu este folosit Dacă elementul cache este invalid (invalid) sau câmpurile de etichetă nu se potrivesc, atunci cuvântul dorit nu este în memorie Această situație se numește cache miss În acest caz, șirul de de octeți este preluat din memoria principală și stocat în cache, înlocuind orice element a fost acolo Cu toate acestea, dacă o intrare în cache existentă este modificată, aceasta trebuie scrisă înapoi în memoria principală înainte de a putea fi înlocuit În ciuda complexității soluției, accesul la cuvântul dorit poate fi extrem de rapid Deoarece adresa este cunoscută, este cunoscută și locația exactă a cuvântului, dacă acesta există în cache Aceasta înseamnă că trebuie să citiți cuvântul din cache, să îl livrați procesorului și, în același timp, să verificați dacă acest cuvânt este corect (comparând câmpurile etichetei) Prin urmare, procesorul primește de fapt cuvântul din cache în același timp sau chiar înainte de a ști dacă cuvântul solicitat este sau nu Cu această schemă, liniile contigue ale memoriei principale sunt plasate în intrările în cache adiacente De fapt, în cache pot fi stocate până la KB de date contigue Cu toate acestea, două șiruri de caractere ale căror adrese diferă cu exact KB ( octeți) sau orice multiplu întreg al acelui număr nu pot fi stocate în cache în același timp (deoarece au aceeași valoare a câmpului șirului) De exemplu, dacă un program accesează date la adresa X și apoi execută o instrucțiune care necesită date la adresa X (sau orice altă adresă de pe aceeași linie), a doua instrucțiune necesită reîncărcarea unei intrări în cache Dacă acest lucru se întâmplă destul de des, atunci Performanta imbunatatita ■b probleme Dacă memoria cache nu funcționează bine, este mai bine să nu aveți deloc un cache, deoarece fiecare operație de pe memoria principală citește o mână întreagă, nu un singur cuvânt Direct Mapping Cache este cel mai comun tip de cache Shiyati și este destul de eficient deoarece coliziunile ca aceasta sunt foarte rare sau nu se întâmplă niciodată De exemplu, un ■Mpilator de înaltă calitate poate lua în considerare astfel de coliziuni atunci când plasează instrucțiunile #DyPpp în memorie Rețineți că acest caz nu va apărea în sistem, comenzile și datele b sunt stocate separat, deoarece solicitările conflictuale ■ Trebuie să fie servite de cache-uri diferite Astfel, vedem al doilea avantaj de a avea două cache-uri în loc de unul - mai multă flexibilitate în rezolvarea situațiilor de conflict ^• memorie cache oocative cu acces multiplu C&K a fost notat mai devreme, diferite linii de memorie principală concurează pentru dreptul de a ocupa aceeași zonă de cache Dacă programul care utilizează psh-memory prezentat în Fig , a, cuvinte cu adrese O ț| , atunci vor exista conflicte constante, deoarece fiecare par-rpcchie va atrage potențial expulzarea uneia sau alteia rânduri din cache Pentru a rezolva această problemă, trebuie să vă asigurați că fiecare cache ^Cement se potrivește cu două sau mai multe linii Un cache cu n intrări posibile pentru fiecare adresă se numește memorie asociativă MSH cu n intrări Cache-ul asociativ cu căi este prezentat în fig Bit Bit Bit Bit 'ѵ - - > - J Element A Element B Element C Element D Orez Cache asociativ cu căi Un cache asociativ cu acces multiplu este în mod inerent mult mai complex decât un cache mapat direct, deoarece, deși o intrare în cache poate fi calculată dintr-o adresă de memorie principală, trebuie verificat dacă De fapt, astfel de ciocniri nu sunt atât de rare datorită faptului că, cu metoda de paginare de organizare a memoriei virtuale și execuția paralelă a mai multor sarcini, paginile par a fi "mixte" Paginarea programului se realizează aleatoriu, astfel încât "localitatea codului" poate fi încălcată - Notă științific ed Plav Nivel de microarhitectură A elementele cache pentru a vedea dacă linia de care avem nevoie este acolo Cu OD, verificarea trebuie făcută foarte rapid Cu toate acestea, practica arată că un cache asociativ cu sau căi dă rezultate bune, PO | introducerea acestor scheme suplimentare este pe deplin justificată Utilizarea unui cache asociativ cu acces multiplu oferă dezvoltatorului o alegere Dacă un element nou trebuie plasat în cache, care dintre elementele vechi ar trebui eliminat? Pentru majoritatea problemelor, algoritmul de procesare a unui element care nu a fost folosit de mult timp (Least Recenly Used, LRU) este bine potrivit Există o specie specifică a fiecărui set de celule disponibile dintr-o celulă de memorie dată De fiecare dată când COP accesează orice rând, conform algoritmului LRtl, lista este actualizată, iar elementul care a fost accesat ultima dată este marcat Când este necesară înlocuirea oricărui element, se elimină T(L) care se află la sfârșitul listei, adică cel care a fost folosit de ceilalți Este posibil și un caz extrem - un cache asociativ cu de moduri care conține un singur set de elemente În acest caz, toate adresele de memorie ajung în acest set, astfel încât căutarea necesită compararea adresei dorite cu toate cele de etichete din cache Rețineți că fiecare element al memoriei cache trebuie să conțină un circuit logic special pentru aceasta Deoarece câmpul șir în acest caz este un câmp marcator, câmpul etichetă este întreaga adresă, cu excepția câmpurilor de cuvânt și octet Mai mult, atunci când o linie de cache este înlocuită, toate cele de elemente sunt posibile candidați pentru înlocuire Stocarea unei liste ordonate de de articole ar necesita o gestionare greoaie a resurselor sistemului, astfel încât algoritmul LRU este ineficient (Reamintim că lista trebuie actualizată cu fiecare operațiune de memorie ) Interesant, un cache cu un număr mare inputs nu depășește întotdeauna memoria cache, în care numărul de intrări este mic, iar în unele cazuri funcționează și mai rău Prin urmare, numărul de intrări mai mare de patru este rar În cele din urmă, scrierile sunt o problemă specială pentru memoria cache Când procesorul scrie un cuvânt și cuvântul se află în cache, trebuie evident fie să actualizeze cuvântul, fie să ștergă intrarea în cache În aproape toate evoluțiile, are loc o actualizare a memoriei cache Dar cum rămâne cu actualizarea copiei din memoria principală? Această operațiune poate fi amânată până mai târziu până când linia cache este gata să fie înlocuită în conformitate cu algoritmul LRU Alegerea este dificilă și nici una dintre soluții nu este preferată Actualizarea imediată a elementului de memorie principal se numește write-through Această abordare este de obicei mult mai ușor de implementat și, în plus, este mai fiabilă, deoarece memoria modernă își poate restabili întotdeauna starea anterioară în cazul unei erori Din păcate, acest lucru necesită transferarea mai multor date în memorie, așa că în proiectele complexe, aceștia tind să folosească o abordare alternativă - writeback sau scriere întârziată Există o altă problemă cu procesul de scriere: ce se întâmplă dacă trebuie să scrieți ceva într-o locație care nu este în cache? Ar trebui ca datele să fie trimise în cache sau doar scrise în memoria principală? Din nou, niciunul dintre răspunsuri nu este cel mai bun din toate punctele de vedere În majoritatea evoluțiilor, F ■ În al doilea rând, se aplică writeback, datele sunt transferate în cache Această practică se numește alocare de scriere Pe de altă parte, în acele modele în care se folosește write-through, elementul nu este de obicei plasat în cache-ul C-write, deoarece acest lucru complică sistemul Umplutura Nmnisi este utilă numai dacă există intrări |DNO repetate pentru același cuvânt sau pentru cuvinte diferite în aceeași linie de cache Eficiența і(|k|)caching-ului este o condiție extrem de importantă pentru îmbunătățirea performanței |T|TH a sistemului din cauza decalajului uriaș dintre vitezele procesorului și memoriei Discuția despre strategiile alternative pentru stocarea în cache este în desfășurare [Sanchez și Kozyrakis, ; Gaur și colab , ] Predicția tranziției Calculatoarele principale В"І X' sunt în mare parte conectate Transportorul prezentat în fig are șapte trepte; doiputerii mai complexe conțin conducte cu zece sau mai multe etape Pipelining fchs funcționează cu un cod liniar, astfel încât instrumentul de preluare a instrucțiunilor poate pur și simplu să preia DOT cuvinte consecutive din memorie și să le trimită la decodor înainte de timp, chiar înainte de a fi necesare Singura problemă este că acest model este complet nerealist Programele nu sunt deloc secvențe liniare ale IPMnd - sunt pline de instrucțiuni de salt Luați în considerare comenzile simple din Listarea Variabila i este comparată cu (probabil cea mai comună comparație în practică) În funcție de rezultatul celeilalte variabile, lui ! i se atribuie una dintre cele două valori posibile Lista Fragment de program ІНі- ) k=l; •ite k= ; O posibilă traducere în limbaj de asamblare este prezentată în Listarea Limbajul de asamblare va fi discutat mai târziu în această carte, dar deocamdată este suficient să știm că este posibil un program mai mult sau mai puțin ca Polis din Listarea Prima comandă compară variabila i cu zero Al doilea sare la eticheta Else (începutul secțiunii else) dacă i nu este egal cu A treia instrucțiune atribuie variabilei k valoarea A patra instrucțiune sare la următoarea instrucțiune de program Compilatorul a pus eticheta Next acolo A cincea comandă atribuie valoarea variabilei k Lista Listarea după traducerea în limbaj de asamblare domnule i, BNE Else thtn: MOV k, BR În continuare F*e: MOV k, Nt"xt: ; comparând i cu ; sari la Else daca nu sunt egali ; atribuirea valorii unei variabile la ; salt necondiționat la Următorul ; atribuirea valorii unei variabile la Vedem că două dintre cele cinci comenzi sunt comenzi de tranziție Mai mult decât atât, una dintre ele, bne, este o instrucțiune de ramură condiționată (o ramură care Capitolul Stratul de microarhitectură se efectuează dacă și numai dacă se execută o anumită mustață în acest caz - aceasta este egalitatea celor doi operanzi ai instrucțiunii anterioare Cel mai lung cod liniar de aici este format din două instrucțiuni, deci este dificil să organizați o conductă de mare viteză La prima vedere, salturile necondiționate, cum ar fi comanda BR Next din Listarea , ar putea să nu pară o problemă ÎN vorbind, în acest caz nu există nicio ambiguitate cu privire la unde să mergem în continuare De ce nu poate unitatea de preluare a instrucțiunii să citească în continuare k de la adresa de destinație (adică de unde se face saltul)? Este foarte convenabil să adăugați de îndată ce apare valoarea lui k (chiar înaintea instrucțiunii condiționale if), dar nu este de dorit să stocați rezultatele în memorie Pentru a preveni suprascrierea registrelor înainte de a se ști dacă rezultatele sunt necesare, trebuie să înlocuiți toate registrele de ieșire care sunt utilizate de instrucțiunea speculativă După cum vă puteți imagina, contorul de acces pentru a ține evidența tuturor acestor situații este foarte complex, dar cu hardware-ul potrivit, este destul de posibil să creați unul Cu toate acestea, în prezența instrucțiunilor speculative, apare o altă problemă care nu poate fi rezolvată prin înlocuirea registrului Ce se întâmplă dacă o comandă speculativă aruncă o excepție? Un exemplu este comanda LOAD, care provoacă o pierdere a memoriei cache pe un computer cu o linie de cache suficient de mare (să zicem de octeți) și memorie care este mult mai lentă decât CPU și cache Dacă avem nevoie de o comandă LOAD și mașina se oprește pentru câteva cicluri în timp ce linia cache este încărcată, atunci acest lucru nu este atât de rău, deoarece acest cuvânt este cu adevărat necesar Dar dacă mașina este inactivă pentru a striga un cuvânt, care, după cum se dovedește mai târziu, nu ne este de nici un folos, acest lucru este complet irațional Dacă există prea multe astfel de "optimizări*", atunci procesorul central va funcționa mai lent decât (dacă nu au existat "optimizări" deloc (Dacă mașina conține o memorie virtuală, care este discutată în Capitolul , atunci execuția speculativă este I Exemple de niveluri de microvrhitѵkіursh oog ILOAD poate cauza chiar accesarea unei pagini lipsă Similar: și poate afecta semnificativ performanța, deci este important să le folosiți ) > otrava computerelor moderne, această problemă se rezolvă prin următoarele > m Aceștia acceptă o comandă specială SPECULATIVE-LOAD, care codifică o încercare de a apela un cuvânt din cache, iar dacă cuvântul nu este acolo, pur și simplu caută un apel Dacă o valoare este găsită în cache și este validă, poate fi folosită, iar dacă nu este în cache, hardware-ul o va prelua imediat Dacă atunci se dovedește că această valoare nu este pentru noi), atunci nu va exista nicio pierdere de timp Situația dificilă poate fi ilustrată de următorul operator: > ) Z = y/x; Aici x, y și z sunt variabile în virgulă mobilă Să presupunem că toate aceste variabile intră în registre în avans, iar instrucțiunea de diviziune flotantă (această instrucțiune este lentă) se deplasează în sus pe grafic și este executată chiar înainte de instrucțiunea condițională if Din nefericire, dacă valoarea lui x este , fO programul se termină ca urmare a unei încercări de împărțire la Astfel, instrucțiunea Meculative provoacă un eșec într-un program inițial corect Mai rău este că programatorul schimbă programul pentru a preveni o astfel de situație, dar eșecul încă apare O soluție posibilă este versiunile speciale ale acelor comenzi care POT arunca excepții În plus, la fiecare registru se adaugă un așa-numit bit otravă Dacă instrucțiunea speculativă eșuează, nu declanșează o capcană de excepție, ci setează bitul otravă ȘI registrul rezultat Dacă acest registru este apoi folosit de o instrucțiune normală, excepția este capturată (cum ar trebui să fie în cazul unei excepții) Cu toate acestea, dacă acest rezultat nu este utilizat, bitul otravă este resetat și crește pentru a nu afecta fluxul programului Exemple la nivel de microarhitectură În această secțiune, în lumina materialului abordat în acest capitol, ne vom uita la trei procesoare moderne Prezentarea noastră va fi scurtă, deoarece computerele sunt extrem de complexe, conținând milioane de porți și nu suntem în măsură să oferim o descriere detaliată Procesoarele oferite ca exemple sunt aceleași ca înainte - Coge i , OMAP și ATmegal Microarhitectura procesorului Coge i La prima vedere, Cope I pare a fi o mașină CISC destul de tradițională, cu un set de instrucțiuni mare și greoi care acceptă operații cu numere întregi pe , și de biți, precum și operațiuni cu virgulă mobilă pe și de biți Are doar registre disponibile pe procesor, iar niciunul nu le repetă pe celelalte Lungimea admisă a comenzii este de - octeți În general, există o arhitectură moștenită standard care face totul greșit OU i lava h nivel de microarhitectură De fapt, procesorul Coge i se bazează pe nuclee RISC moderne cu pipelining avansat Viteza sa de ceas este deja foarte Mka, iar în următorii ani este probabil să crească și mai mult Uimitorii ingineri Intel, bazați pe o arhitectură arhaică, au reușit să construiască un proces care îndeplinește toate cerințele moderne Deci, în această subsecțiune, ne uităm la microarhitectura Coge I și înțelegem principiile funcționării acesteia '( Prezentare generală a microarhitecturii Sandy Bridge Microarhitectura Core i , denumită Sandy Bridge, a marcat o abatere semnificativă față de generațiile anterioare de microarhitecturi, inclusiv P și Orez Microarhitectura Core I Coge i constă din patru blocuri principale: un subsistem de memorie, un bloc de preprocesare, un bloc de control al execuției cu o modificare a secvenței și un bloc de execuție Luați în considerare aceste blocuri în ordine, începând din stânga sus și mișcându-se în sens invers acelor de ceasornic Fiecare procesor Coge I conține un subsistem de memorie cu un cache L (L ) partajat, precum și logica de acces la cache L (L ) Toate procesoarele au o cache comună de nivel - aceasta este "ultima oprire", după care accesul părăsește cipul CPU și este trimis prin autobuz într-o călătorie foarte lungă către memoria externă Volumul cache-urilor L în Cor i este de KB; sunt un cache asociativ cu căi cu linii de de octeți Mărimea memoriei cache L partajată variază de la la MB Cu cât plătiți mai mult Intel, cu atât mai mare va fi memoria cache Indiferent de dimensiune, cache-ul L este exemple la nivel de microarhitectură ooh Cache asociativă ID cu linii de de octeți Dacă o solicitare la nivelul cache-ului eșuează, aceasta este transferată în memoria externă prin l)l)R Există două dispozitive de preluare preliminare asociate cu e-pem-urile de prim nivel (nu sunt prezentate în figură) care încearcă să transfere date din memoria principală înainte ca datele să fie solicitate Un bloc preface următorul bloc de memorie atunci când întâlnește o memorie secvențială ca transmisă procesorului Al doilea bloc de limitare, mai complex, ține evidența secvenței de adresă citită/ a unui anumit program Dacă operațiunile sunt efectuate cu o constantă (de exemplu, x x x ), blocul preselectează următorul, care este cel mai probabil să fie accesat de program Preluarea (' în incremente constante este extrem de eficientă în programele care preiau matrice de variabile structurate Subsistemul de memorie din fig G este asociat atât cu preprocesorul, cât și cu memoria cache de date L Blocul de preprocesare este responsabil pentru preluarea instrucțiunilor din subsistemul de memorie, decodificarea lor în micro-opțiuni în stil RISC și stocarea lor în două cache de instrucțiuni Toate instrucțiunile după lucru sunt plasate în memoria cache de instrucțiuni L (primul nivel) Mărimea cache-ului L este de KB, este o memorie cache asociativă cu intrări £ (în șiruri de octeți În timpul preluării din cache-ul L , comenzile se încadrează în ds-IODgrі, care determină secvența micro-operațiilor utilizate pentru a implementa comanda în conducta de execuție Mecanismul de decodare vă permite să "construiți punți" între setul de instrucțiuni CISC moștenit și calea de date RISC modernă Micro-op-urile decodificate sunt trecute în memoria cache-ului micro-op, la care Intel se referă ca "cache-ul de instrucțiuni L (nivel zero)" Cache-ul micro-op seamănă cu un cache tradițional de instrucțiuni, dar are suficient spațiu pentru a stoca secvențe de micro-operații generate de instrucțiuni individuale Deoarece nu instrucțiunile originale sunt memorate în cache, ci micro-opțiunile decodate, nu este nevoie de re-decodare în timpul execuțiilor ulterioare ale comenzii La prima vedere, poate părea că Intel a făcut ceva pentru a accelera conducta (într-adevăr, memorarea în cache accelerează procesul de generare a instrucțiunilor), dar Intel susține că memoria cache micro-op a fost adăugată pentru a reduce consumul de energie de către preprocesor Cu un cache de microoperații, restul blocului petrece % din timp în modul "sleep" cu un consum minim de energie Predicția ramurilor este realizată și în blocul de preprocesare Predictorul trebuie să "ghicească" când execuția programului se va abate de la o probă strict secvențială și trebuie să facă acest lucru cu mult înainte de execuția instrucțiunilor de tranziție În Cor i acest bloc funcționează foarte eficient Din păcate, în majoritatea arhitecturilor, detaliile predictorilor de ramuri sunt ținute secrete Faptul este că performanța predictorului este adesea cel mai important factor care determină viteza globală a arhitecturii Cu cât proiectanții de putere predictivă stoarce din fiecare milimetru pătrat de siliciu, cu atât performanța întregii arhitecturi este mai mare De aceasta acu nivel de microarhitectură ilvvn Acesta este motivul pentru care companiile își păstrează secretele sub cheie și chiar amenință lucrătorii FD cu acțiuni în justiție dacă doresc să-și împărtășească cunoștințele prețioase Este suficient să spunem că toate blocurile de predicție urmăresc rezultatele tranzițiilor anterioare și folosesc aceste informații pentru predicțiile DAR Secretul este să alcătuiți o listă detaliată de trasabile pentru a arăta cum sunt stocate și utilizate La urma urmei, dacă găsești dintr-o dată o modalitate incredibilă de a prezice viitorul, nici nu o pui pe internet pentru ca toată lumea să o vadă Instrucțiunile sunt transmise din memoria cache micro-op către programatorul de instrucțiuni ordine determinată de program, dar atunci când sunt executate, mă pot abate de la această ordine După ce a găsit un micro-operator care nu poate fi executat, Command Scheduler îl menține în timp ce continuă să proceseze comenzile - sunt lansate toate comenzile ulterioare care nu necesită resurse suplimentare (registre, blocuri funcționale etc ) Aici Da se realizează înlocuirea registrului, datorită căreia RĂZBOIUL și WAW sunt interdependente comenzile pot fi executate fără întârziere lі Deși ordinea în care sunt emise comenzile poate diferi de cea specificată în program, cerința de precizie a întreruperii Coge I prevede că rezultatele execuției comenzilor ISA trebuie făcute vizibile pentru program fără a se abate de la secvența specificată de program Blocul stațiunii este responsabil pentru implementarea acestei cerințe " Unitățile de execuție implementează direct operațiuni cu numere întregi în virgulă mobilă și instrucțiuni specializate Există mai multe unități de execuție care funcționează în paralel Ei primesc date din fișierul de registru și din memoria cache a datelor de la primul nivel Conveyor Sandy Bridge la Coge i eu ia fig Figura prezintă o diagramă simplificată a microarhitecturii Sandy Bridge, inclusiv conducta acesteia În partea de sus a diagramei este un bloc de preprocesare responsabil pentru preluarea instrucțiunilor din memorie și pregătirea lor pentru execuție Acest bloc primește noi instrucțiuni x din memoria cache de instrucțiuni de primul nivel Acestea sunt decodificate în micro-op-uri și plasate într-un cache-micro-op care conține aproximativ , K micro-op-uri În ceea ce privește performanța, este comparabil cu un cache tradițional de nivel zero de KB În memoria cache a micro-operațiunilor, fiecare șase micro-operații sunt combinate într-un grup care ocupă o linie Pentru a forma secvențe mai lungi de micro-operații, se folosește concatenarea șirurilor Dacă blocul de decodare întâlnește o ramură condiționată, se întoarce la blocul de predicție a ramurii pentru informații Acest bloc conține un istoric al salturilor care au avut loc în trecut și, pe baza datelor acumulate, sugerează dacă un salt condiționat va fi efectuat atunci când va avea loc următoarea în program Aici sunt utilizați algoritmii secreti menționați mai sus Dacă comanda de salt nu este în tabel, se aplică predicția statică Aceasta implică faptul că tranziția inversă, în primul rând, face parte din ciclu și, în al doilea rând, se presupune implicit că va fi efectuată Precizia prognozei statice în acest caz este foarte mare Drept Bloc de preprocesare І'Н№!'ІІІ ІПНПІЦІМКІШІ Bloc de decodare Branch Predictor / Branch Object Buffer Kinirol inyulnvnia MNMvneni-•M secvență Distribuția și înlocuirea blocurilor G și Pentru cache partajată de nivel ALU ALU -' : ALU ka Conservare Încărcare - Încărcare Bloc stațiune Orez Diagrama simplificată a căii de date Core I în ieșire este considerată a fi parte a structurii instrucțiunii if și nu este executată implicit Precizia unei prognoze statice în cazul tranzițiilor directe valoare-input este mai mică decât în cazul celor inverse Pentru ramura selectată, adresa de destinație este determinată din conținutul bufferului de ramură, sau BTB BTB stochează adresa de destinație a saltului de la ultima execuție Această adresă este de obicei corectă (de fapt, este întotdeauna invalidă pentru salturi cu un offset constant) Salturile indirecte (de exemplu, cele folosite în apelurile de funcții virtuale și în comenzile C++ * "wltch) merg la adrese diferite și vor fi prezise eronat din datele IITB A doua componentă a conductei, logica de execuție a resecvenței, primește date din memoria cache-ului micro-op Când fiecare micro-operație ulterioară sosește din stocul de preprocesare (și există trei dintre ele pe nichel), blocul de distribuție și substituție o înregistrează în ta-Gnipcs, constând din de intrări și numită comanda de reordonare buffer (ReOrder Buffer, ROB) Acest buffer stochează date despre starea micro-operației, până la resortarea rezultatelor acesteia Apoi blocul de distribuție și substituție verifică disponibilitatea resurselor necesare realizării micro-operației Dacă resursele sunt libere, micro-operația este instalată într-una dintre cozile programatorului Sunt furnizate cozi separate pentru micro-operațiunile executate în memorie și în afara memoriei Dacă executarea unei micro-operații este imposibilă în prezent, aceasta se amână, dar procesarea micro-operațiilor ulterioare continuă; astfel, micro-opțiunile sunt adesea executate în afara secvenței lor inițiale Acest principiu vă permite să susțineți încărcarea tuturor blocurilor funcționale cel mai înalt nivel posibil În orice moment, până la de comenzi pot fi procesate simultan, dintre care pot fi încărcate din memorie, iar pot fi stocate în memorie Uneori, micro-operatorii sunt inactiv Acest lucru se întâmplă în acele cazuri când unul și același registru pentru citire sau scriere încearcă să acceseze câte micro-operații; în consecință, unul dintre ei reușește, în timp ce ceilalți nu Astfel de conflicte, după cum am aflat deja, se numesc interdependențe WAR și WAW Înlocuirea registrului țintă vă permite să scrieți rezultatele execuției microoperației într-unul dintre cele de registre temporare și znachi executați imediat această micro-operație Dacă toate registrele temporare nu sunt disponibile sau micro-operatorul intră într-o situație de dependență RAW (care nu poate fi ocolită), planificatorul indică natura problemei ca o intrare în buffer-ul ROB Ulterior, după ce se eliberează resursele necesare, microoperația este plasată într-una dintre cozile de execuție Cozile de planificare plasează operațiuni gata de executat într-unul din cele șase blocuri funcționale: ALU și unitatea de multiplicare în virgulă mobilă Blocul de adunare/scădere ALU și virgulă mobilă ALU , ramură în virgulă mobilă și unitate de procesare a comparației Salvați comenzile Descărcați comenzi Descărcați comenzi Deoarece programatoarele și ALU-urile pot procesa o operație pe ciclu, performanța programatorului Cope i de GHz atinge miliarde de operațiuni întregi pe secundă; totuși, în practică, această viteză nu este niciodată atinsă Deși blocurile funcționale nu pot oferi o încărcătură completă de resurse executive, o fac! putere de execuție suficientă, motiv pentru care unitatea de control al secvenței caută cu atâta sârguință locuri de muncă pentru ei Cele trei ALU-uri întregi nu sunt la fel ALU efectuează orice operații aritmetice și logice, înmulțiri și împărțiri ALU este capabil doar să efectueze operații aritmetice și logice ALU efectuează operații aritmetice și logice, precum și rezoluția tranzițiilor Cele două blocuri de execuție în virgulă mobilă nu sunt, de asemenea, identice Primul acceptă aritmetica în virgulă mobilă, inclusiv înmulțirea, în timp ce cel de-al doilea poate efectua doar adunări și scăderi în virgulă mobilă, precum și mișcări Unitățile de execuție ALU și în virgulă mobilă primesc date din două fișiere de registru cu o capacitate de de intrări Unul dintre aceste fișiere este pentru numere întregi, celălalt pentru numere în virgulă mobilă Acestea conțin toți operanzii necesari executării instrucțiunilor; în plus, ele joacă rolul unui depozit de rezultate Datorită înlocuirii registrelor, opt dintre ele conțin registre disponibile la nivelul arhitecturii instrucțiunilor (EAX, EBX, ECX, EDX etc ), dar locația valorilor "reale" în fiecare caz depinde de modificările în maparea care apar în timpul execuției Arhitectura Sandy Bridge II a introdus AVX (Advanced Vector I Heiinons), oferind suport pentru operații vectoriale pe de biți, izh|i'i'іg/іyіy pe date (atât cu vectori întregi, cât și cu vectori • n'іyіshyuіtsey dot) În noua extensie ISA, dimensiunea vectorului este dublă față de dimensiunea extensiilor ISA anterioare SSE și SSE Cum este arhitectura operațiunilor I"" ii'iii uier pe de biți cu căi de date pe de biți și funcții bloc ii/ii? Două porturi de planificare pe de biți sunt combinate • în formarea unui bloc funcţional de de biţi Primul tip de date de strat este strâns legat de conducta internă a Sandy Bridge Această memorie cache de de kiloocteți poate stoca numere întregi, numere în virgulă mobilă și alte tipuri de date Spre deosebire de cache-ul micro-op, aceste date nu sunt decodificate în niciun fel Funcția cache-ului i'іnііх (conduce la stocarea de copii ale octeților care se află în memorie În ceea ce privește caracteristicile sale, cache-ul de date de la primul nivel este un cache asociativ cu intrări cu o capacitate de linie de de octeți Acceptă în alte cuvinte, atunci când o linie de cache se schimbă, aceasta este imediat copiată înapoi în memoria cache L În timpul unui ciclu, memoria cache a datelor L poate efectua două citiri și o scriere "Voi folosi mai multe cache interne ( în cazul Podul de nisip) • Igiryitsgpiya se referă la diferite bănci, acestea pot fi efectuate simultan; і" în caz contrar, unul dintre apelurile către băncile aflate în conflict este inactiv II /in pentru cuvântul solicitat nu poate fi găsit în cache-ul de primul nivel, trimițând o cerere către cache-ul de al doilea nivel; acesta din urmă într-o astfel de situație fie răspunde la i riza, fie se referă la cache-ul general al celui de-al treilea nivel, după care răspunde II /breakdown, până la zece solicitări pot fi în stare de execuție în acest moment, direcționate din cache-ul de primul nivel către cache-ul de al doilea nivel Deoarece micro-operațiile sunt executate din secvența originală, • Salvarea în memoria cache a primului nivel este posibilă numai după resortarea re și 'imatele tuturor comenzilor care preced comanda de salvare Această sortare a rezultatelor cu urmărirea lor (ținând evidența unde sunt) ulii yul cinci stațiune bloc În cazul unei întreruperi, procesarea niciunuia dintre comenzile care nu au trecut încă de recurgerea rezultatelor nu se încetează; astfel se asigură respectarea cerinţei conform căreia, la întrerupere, trebuie Porc a finalizat toate comenzile până la un anumit punct din program Dacă comanda de salvare și-a resortat rezultatele, dar comenzile anterioare și următoare sunt încă în curs de procesare, rezultatele execuției lor sunt transferate în memoria tampon de comandă în așteptare deoarece memoria cache de prim nivel nu poate fi actualizată În acest buffer pot fi plasate până la de comenzi de salvare simultan Dacă una dintre comenzile de încărcare ulterioare încearcă să citească datele stocate, aceasta va fi redirecționată din bufferul de comandă în așteptare direct la comanda care nu este încă plasată în memoria cache de date de la primul nivel în acel moment Acest proces se numește redirecționare slorc-to-load Deși mecanismul de redirecționare poate părea elementar, în practică este destul de dificil de implementat - se poate dovedi că operațiunile de salvare în așteptare nu și-au calculat încă adresele In aceea În acest caz, microarhitectura nu poate ști cu siguranță care dintre operațiunile de salvare va produce valoarea dorită Deci, este destul de evident că Core I are o microarhitectură complexă, a cărei soluție de proiectare este determinată de necesitatea de a sprijini setul de instrucțiuni Pentium moștenit pe un nucleu RISC modern cu un nivel ridicat de pipelining Acest obiectiv este atins prin împărțirea instrucțiunilor Pentiuin în micro-op-uri, memorarea lor în cache și trecerea lor (trei micro-op-uri odată) în conductă, unde sunt executate de mai multe ALU-uri care, în condiții optime, procesează până la șase micro-operații pe ciclu Micro-operațiile sunt executate cu o abatere de la secvența originală, dar returnează n și și sunt stocate în memoria cache a primului și al doilea nivel în ordinea specificată Microarhitectura Omap Sistemul TMAP cu un singur cip este dominat de două procesoare ARM Cortex A Cortex A este o microarhitectură de înaltă performanță implementarea setului de instrucțiuni ARM (versiunea ) Procesorul a fost proiectat de ARM Ltd; diversele sale modificări se găsesc într-o gamă largă de sisteme încorporate ARM nu produce procesorul, ci furnizează dezvoltările acestuia doar producătorilor de cipuri electronice care doresc să-l implementeze în sistemele lor cu un singur cip (în acest caz, Texas Instruments) Procesorul Cortex A este o mașină pe de biți cu registre de de biți și o cale de date pe de biți Busul de memorie, ca și arhitectura internă, este pe de biți Spre deosebire de Cortex i , procesorul Cortex A a fost conceput inițial ca un sistem RISC complet Prin urmare, nu a fost nevoie de un mecanism complex pentru convertirea vechilor comenzi CISC în micro-operații în acest caz Comenzile kernelului sunt micro-opțiuni gata făcute Cu toate acestea, în ultimii ani, au fost adăugate comenzi grafice și multimedia mai complexe care necesită dispozitive speciale pentru a fi executate Prezentare generală a microarhitecturii Cortex A Schema bloc a microarhitecturii Cortex A este prezentată în fig În general, este mult mai simplă decât microarhitectura Sandy Bridge utilizată în sistemele Cori i , ceea ce se explică prin complexitatea mai mică a arhitecturii setului de instrucțiuni Cu toate acestea, în unele componente de bază, pot fi urmărite asemănări cu Core i În primul rând, acest lucru se datorează factorilor tehnologici și economici De exemplu, ambele arhitecturi folosesc o ierarhie de stocare în cache pe niveluri pentru a îndeplini constrângerile stricte de cost ale aplicațiilor încorporate tipice; cu toate acestea, dimensiunea ultimului nivel al cache-ului Cortex A (L ) este de doar MB; în aceasta este semnificativ inferior procesorului Coge i , în care memoria cache de ultimul nivel (L ) poate ajunge la MB Diferențele se datorează în mare parte faptului că, în primul caz, dezvoltatorii au trebuit să ofere suport pentru setul moștenit de comenzi CISC, în timp ce în al doilea, o astfel de sarcină nu a fost stabilită În partea de sus a Fig Figura prezintă un cache de instrucțiuni asociative cu căi de K cu linii de de octeți Pentru că majoritatea echipelor exemple de niveluri microvrchitktursh b Inhalați predicția ramurilor/cache-ul adresei ramurilor Recursul Orez Diagrama structurală a microarhitecturii Cortex A a sistemului cu un singur cip OMAP La memoria LPDDR ARM ocupă octeți, în acest cache pot fi plasați aproximativ de Cymands în același timp - mult mai mult decât cache-ul micro-op Coge i Blocul de apel de instrucțiuni pregătește până la patru instrucțiuni pentru execuție per ciclu În cazul accesului nereușit la memoria cache a primului nivel, numărul de comenzi apelate este redus Când este detectată o ramură condiționată, se accesează un cache de adrese de salt cu o capacitate de de intrări; pe baza conținutului, se prevede prezența sau absența unei tranziții De asemenea, dacă preprocesorul detectează că programul rulează ȘI într-o buclă strânsă (o buclă mică care nu este imbricată), îl încarcă într-un cache special (cache de preluare paralelă pentru bucle rapide) Această optimizare accelerează preluarea instrucțiunilor și reduce consumul de energie, deoarece memoria cache și predictorii pot dormi în timpul unui ciclu dens Rezultatele blocului de apel de comandă sunt transmise decodoarelor, care decid ce resurse și datele de intrare vor avea nevoie comenzile Ca și în Cor I , codul de decodare este schimbat pentru a elimina conflictele WAR care pot încetini execuția cu resecvențiere După redenumire, comenzile sunt plasate în coada de distribuție a comenzilor, care le emite atunci când datele de intrare pentru blocurile funcționale sunt gata (eventual cu o modificare a secvenței) După cum se poate observa din fig , coada de distribuție a comenzilor trimite comenzi către blocurile funcționale Blocul de calcul întreg conține două ALU-uri ȘI o conductă scurtă pentru comenzile de salt De asemenea, conține un fișier de registru fizic care conține registrele ISA și unele registre temporare Conducta Cortex A poate conține, de asemenea, unul sau mai multe nuclee de procesare care funcționează ca blocuri funcționale suplimentare ARM acceptă un nucleu de calcul VFP în virgulă mobilă și un nucleu cu numere întregi vectoriale SIMD numit NEON ilaaa -t /rivppv MICROARHITECTURILE Blocul de încărcare/salvare gestionează diferitele sarcini de încărcare și salvare Este asociat cu memoria cache de date și cu buffer-ul de salvare Cache-ul de date este de K de octeți și este un cache de date L cu căi cu linii de de octeți Bufferul de salvare conține comenzi de stocare X^M care nu și-au scris încă valorile în memoria cache a datelor stațiunii) Comanda de încărcare care este executată încearcă mai întâi să-și preia valoarea din buffer-ul de execuție, folosind un mecanism de redirecționare la încărcare similar cu mecanismul Core i corespunzător Dacă valoarea O^H nu este în memoria tampon de salvare, aceasta va fi preluată din memoria cache de date Într-unul dintre rezultatele posibile ale executării comenzii de încărcare, buffer-ul de salvare ordonă să aștepte, deoarece executarea comenzii este blocată de o operație de salvare timpurie cu o adresă necunoscută Dacă un acces la date L eșuează, blocul de memorie este preluat din memoria cache L grupată În unele circumstanțe, Cortex A efectuează, de asemenea, preluare la nivel hardware a datelor din memoria cache L în L pentru a ÎMBUNĂTĂȚI eficiența operațiunilor de încărcare și stocare L Cipul OMAP conține, de asemenea, logica de control al accesului la memorie Această logică este împărțită în două părți: interfața de sistem și controlerul de memorie Interfața sistemului interacționează cu memoria printr-o magistrală LPDDR pe de biți Toate cererile de memorie externă trec prin această interfață Magistrala LPDDR trimite o adresă de de biți pentru bănci, returnând un cuvânt de date de de biți Teoretic, cantitatea de memorie principală pentru fiecare canal LPDDR poate fi de până la GB OMAP are astfel de canale DVI, astfel încât sistemul este capabil să abordeze până la GB de memorie externă Controlerul de memorie convertește adresele virtuale de de biți în adrese fizice de de biți Cortex A acceptă memoria virtuală II (vezi capitolul ) cu o dimensiune a paginii de KB Pentru a accelera procesul de conversie, sunt furnizate tabele speciale numite Translation Lookaside Buffers (TLB) Ei compară adresa virtuală actuală cu adresele care au fost accesate în trecutul recent Transportor Cortex A în OMAR Conveior Cortex A din trepte; este prezentat într-o formă simplificată în Fig În partea stângă a figurii, pașii sunt indicați prin abrevieri Să luăm în considerare fiecare dintre ele separat Deschide treapta transportoare Fe (Fetch - fetch ) Folosește adresa următoarei instrucțiuni pentru a indexa memoria cache a instrucțiunilor și pentru a începe predicția ramurilor Această adresă urmează de obicei imediat următoarei instrucțiuni, dar secvența de execuție liniară poate fi întreruptă din diverse motive - să zicem, dacă instrucțiunea anterioară este un salt prezis, o capcană de excepție sau o întrerupere care trebuie gestionată Deoarece preluarea instrucțiunilor și predicția ramurilor durează mai mult de un ciclu, etapa Fe oferă timp suplimentar pentru a efectua aceste operații În etapa Fe , comenzile selectate (până la patru) sunt introduse în coada de comenzi ' ІuІІvIy Blocarea apelurilor de comandă G II Ceas de predicție de tranziție ІІІ ІІІ/ Nu ІН G- Hm/ -■m Hm WB Decodificarea comenzilor Înlocuirea comenzilor Orez Diagrama simplificată a conductei Cortex A în OMAP La pașii De (Decode ) și De , comenzile selectate sunt decodificate Etapele determină ce date de intrare vor avea nevoie instrucțiunile (registre și memorie) și ce resurse vor fi necesare pentru a le executa (blocuri funcționale) După finalizarea decodării, comenzile sunt transferate în etapa ( Re (Redenumire), în care are loc înlocuirea registrului pentru a elimina conflictele dintre WAR și WAW atunci când sunt executate cu o modificare a secvenței În această etapă, există un tabel de înlocuire cu informații despre ce registru fizic conține în prezent toate registrele arhitecturale Folosind acest tabel, puteți înlocui cu ușurință orice registru de intrare Registrelor de ieșire trebuie să li se acorde un nou registru fizic i lava * nivelul microarhitecturii un registru care este preluat din grupul de comenzi fizice neutilizate Registrul fizic alocat va fi folosit de comanda VPD pentru a-l completa În continuare, comenzile ajung în etapa Iss (Instruction Issue), în kotojx sunt plasate în coada de apeluri de comandă Coada de apeluri ține evidența ce | comenzile sunt gata pentru introducere Când este gata, scena primește date de registru (de la un fișier de registru fizic sau un bypass după care comanda se trece la etapele executive La fel ca C, Cortex A poate emite comenzi într-o ordine diferită de ordinea în care au fost scrise în program Pot fi emise până la patru comenzi pe ciclu, comenzi limitate de disponibilitatea blocurilor funcționale Execuția reală a instrucțiunii are loc în etapele Ex (Exec) Majoritatea instrucțiunilor aritmetice, logice și c folosesc ALU întregi și se completează într-un singur ciclu Încărcarea și stocarea durează două cicluri (când atingeți memoria cache L ), iar înmulțirea durează un ciclu Etapele Ex conțin mai multe blocuri funcționale: ALU pentru operații cu numere întregi ALU pentru operații cu numere întregi Bloc de multiplicare ALU pentru operații în virgulă mobilă și operații vectoriale SIMD (posibil, cu suport pentru VFP și NEON) Încărcarea și depozitarea blocurilor În prima etapă sunt procesate și instrucțiunile de ramificare condiționată, iar prezența/absența unei ramuri este determinată Dacă predicția este greșită, semnalul revine în treapta Fe și transportorul este anulat După finalizarea execuției, instrucțiunile intră în etapa WB (WriteBack), unde fiecare instrucțiune actualizează direct fișierul de registru fizic Teoretic, ulterior, când instrucțiunea este cea mai veche în curs de executare, aceasta își va scrie rezultatul registrului în fișierul registrului arhitectural Dacă apare o excepție sau o întrerupere, aceste valori devin vizibile, nu cele stocate în registrele fizice Actul de păstrare a cazului într-un fișier de arhitectură este echivalent cu recurgerea în Cor I În plus, în etapa WB, toate instrucțiunile de stocare își finalizează scrierea rezultatelor în memoria cache de date L Descrierea noastră a Cortex A nu este completă, dar oferă o idee despre cum funcționează și cum diferă de microarhitectura Cortex I Microarhitectura microcontrolerului ATmegal Diagrama de microarhitectură din ultimul nostru exemplu, Atmel ATmegal , este prezentată în Fig Este mult mai simplu decât microarhitecturile Coge i și OMAP Cert este că un cip destinat pieței încorporate trebuie să fie foarte mic și ieftin În consecință, scopul principal în proiectarea ATmegal a fost ieftinitatea, nu viteza După cum știți, "ieftin" și "simplu" sunt concepte foarte apropiate, în timp ce ieftinitatea și viteza în contextul nostru sunt rareori combinate Bus principal (V-bit) Orez Microarhitectura Atmel ATmegal Centrală pentru microarhitectura ATmegal este magistrala principală de biți Asociați cu acesta sunt registre și biți de stare, ALU-uri, memorie și dispozitive I/O Să le descriem acum pe scurt Fișier de înregistrare nc șindrilă de de registre de biți utilizate pentru stocarea datelor temporare Registrul de stare și registrul de control conțin semne ale celei de-a doua operațiuni a ALU (semn, overflow, negativitate, zero, carry), precum și bitul de întrerupere în așteptare Contorul programului conține adresa instrucțiunii în curs de executare Pentru a efectua o operație A /IU, trebuie mai întâi să citiți operanzii din registre și să-i transmiteți la ALU Ieșirea ALU este scrisă în orice registre inscriptibile prin magistrala principală ATmegal folosește mai multe tipuri de memorie pentru comenzi și date Mărimea memoriei magice de date este de KB, prea mult pentru a fi adresată complet de o adresă de biți pe magistrala principală Din acest motiv, arhitectura AVR permite construirea de adrese dintr-o pereche serială de registre H biți; rezultatul este o adresă de biți care acceptă până la KB de memorie de date EEPROM oferă până la KB de memorie nevolatilă în care programele pot scrie variabile care • supravieţuiesc unei posibile întreruperi de curent Există un mecanism similar pentru adresarea numelor de software, dar KB este prea mic pentru cod, chiar și în sistemele încorporate ieftine Pentru a aborda o memorie mai mare de instrucțiuni, arhitectura AVR va defini trei registre de pagină (RAMPX, RAMPY și RAMPZ), fiecare cu un dimensiune de biți Registrul de pagină este combinat cu o pereche de registru de biți pentru a forma o adresă de program de de biți, permițând adresarea a până la MB de spațiu de adrese de instrucțiuni Gândiți-vă pentru o secundă: KB de cod este prea puțin pentru un microcontroler care poate rula o jucărie sau un dispozitiv electronic mic În , IBM a lansat computerul System Model , care avea KB de memorie totală (nu poate fi extinsă) Computerul s-a vândut cu de dolari, ceea ce echivalează cu aproximativ două milioane la prețurile de astăzi ATmegal costă aproximativ USD - și mai puțin pentru un lot mare Dacă te uiți la prețurile avioanelor Boeing, este ușor de observat că acestea nu au scăzut de de ori în ultimii de ani Același lucru se poate spune despre mașini, televizoare și alte tehnologii - despre orice, cu excepția computerelor În plus, ATmegal include un controler de întrerupere la bord, interfață cu port serial (SPI) și temporizatoare necesare pentru aplicațiile în timp real Există, de asemenea, trei porturi I/O digitale pe biți, cu ajutorul cărora ATmegal poate controla până la de butoane externe, indicatoare, senzori etc Prezența temporizatoarelor și a porturilor de intrare/ieșire face posibilă utilizarea ATmegal în embedded sisteme cu microcircuite suplimentare Procesorul ATmegal aparține categoriei sincrone - majoritatea comenzilor pe care le procesează sunt finalizate într-un singur ciclu Name Processor * arhitectură pipelined: în procesul de preluare a unei instrucțiuni, instrucțiunea anterioară este executată Cu toate acestea, conducta constă doar din două etape - preluare și execuție Pentru ca preluarea instrucțiunilor să aibă loc într-un singur ciclu, ciclul trebuie să permită citirea registrului din fișierul de registru, executarea instrucțiunii în ALU și apoi scrierea registrului înapoi în fișierul de registru Deoarece toate aceste operații au loc într-un singur ciclu, ocoliți sau nu este necesară logica de detectare a reținerii Comenzile programului sunt executate în ordine, într-un singur ciclu și fără suprapunere cu alte comenzi Dispozitivul ATmegal ar putea fi descris mai detaliat, cu toate acestea, descrierea disponibilă și circuitul prezentat în fig este suficient pentru a vă face o idee generală ATmegal are o magistrală principală (care reduce dimensiunea cipului), un set eterogen de registre și mai multe tipuri de memorie și dispozitive I/O conectate la magistrala principală În timpul fiecărui ciclu al căii de date, doi operanzi sunt citiți din fișierul de registru, trecuți prin ALU, iar rezultatele sunt din nou stocate în registre, la fel ca pe computerele mai moderne Comparație între procesoarele I , OMAP și ATmegal Aceste trei procesoare diferă unul de celălalt în multe privințe, dar au o caracteristică surprinzătoare care poate ajuta la proiectarea unui computer Coge i acceptă un set de instrucțiuni CISC vechi pe care îl proiectează exemple la nivel de microarhitectură Ii Intel ar fi bucuros să fuzioneze în cel mai apropiat corp de apă, dar aceasta ar fi legislația lor necondiționată și de mediu OMAP este un set de instrucțiuni "pur" RISC-• eficient ATmegal este un simplu p de biți pentru sistemele încorporate În centrul tuturor exemplelor prezentate se află contoarele și una sau mai multe ALU-uri care efectuează operații aritmetice booleene simple cu operanzi din registre În ciuda diferențelor, Coge i și OMAP au funcționalități similare ale ambelor blocuri funcționale care primesc micro-operații, în care co-i este codul de operare și sunt specificate două registru de intrare și unul de ieșire rm efectua o micro-operație într-un ciclu Ambele sunt pipeline, predicție de ramuri și memorie cache partajată pentru unele date asemănarea internă nu este întâmplătoare, motivul pentru care nu este deloc tranziția inginerilor de la o companie din Silicon Valley la alta; da, am luat în considerare micro-arhitecturile Mіs- și Mіs- , am văzut că este exact ușor să construiți o cale de date canalizată cu două AI ca surse, în care valorile acestor registre sunt trecute prin ALU, iar rezultatul este stocat în registru Pe fig prezintă o imagine a unui astfel de transportor Pentru tehnologia modernă, acesta este un sistem eficient Principala diferență dintre Coge i și OMAP este modul în care comenzile H sunt transmise blocului funcțional Calculatorul Coge i trebuie să spargă instrucțiunile CIsc pentru a le converti în formatul cu registre cerut de CI al blocului funcțional Acest proces este prezentat în Fig - time-epms de comenzi mari în micro-operații mici OMAP nu trebuie să facă nimic, deoarece comenzile sale sursă sunt deja micro-opțiuni convenabile și compacte Acesta este motivul pentru care majoritatea noilor arhitecturi ISA sunt de tip RISC, care oferă combinația optimă de instrucțiuni Iibor și mecanismul intern de executare a acestora Este util să comparăm cea mai recentă dezvoltare a noastră, microarhitectura Mis- , cu aceste două mașini reale Mis- seamănă mai mult cu Coge i Ambele sisteme interpretează comenzi care nu sunt comenzi RISC Pentru a face acest lucru, ambele sisteme împart instrucțiunile în micro-operații, care indică codul de operare, două registru de intrare și unul de ieșire În ambele cazuri, micro-operațiunile sunt puse în coadă pentru execuții ulterioare În Міс- , micro-operațiunile sunt permise strict în ordine, executate strict în ordine și finalizate exact în aceeași ordine În Cohr i , micro-operațiunile sunt pornite în ordine, executate în ordine aleatorie și finalizate din nou în ordine Compararea Mis- și OMAP este incorectă, deoarece comenzile sistemului OMAP sunt comenzi RISC (adică micro-opțiuni cu registre) Ele nu trebuie să fie împărțite sau combinate Ele pot fi executate așa cum sunt, fiecare într-un ciclu de cale de date Dar, în comparație cu Coge i și TMAP , mașina ATmegal este foarte simplă Microarhitectura sa seamănă mai mult cu RISC decât cu CISC, deoarece instrucțiunile simple sunt executate într-un singur ciclu, fără a fi împărțite în părți componente Nu este prevăzută nici pipeline, nici cache Comenzile sunt executate, executate și returnează rezultatele în ordine În simplitatea sa, ATmegal seamănă cu Mis- ilvvn nivel de micro arhitectură Rezumatul capitolului n" este prezentat în fig , este situat între nivelurile de micro-arhitectură și sistemul in-rațional Din punct de vedere istoric, acest nivel s-a dezvoltat înaintea tuturor celorlalte niveluri și a fost inițial singurul Astăzi acest nivel • și ii adesea denumită "arhitectura" mașinii și uneori (incorect) asamblator ni ihdM" Nivelul arhitecturii setului de instrucțiuni este de o importanță deosebită: este • іні іуіоіцм legătura între software și hardware Desigur, ar putea fi posibil ca hardware-ul să injecteze direct programe scrise în C, C++, Java sau alte limbaje de nivel înalt, dar aceasta nu este o idee bună Avantajul compilarii fata de nigrnretizare s-ar pierde atunci În plus, dintr-o perspectivă pur practică, computerele trebuie să fie capabile să execute programe scrise în mai multe limbi, și nu doar una Practic, toți designerii de sisteme cred că programele scrise în diferite limbi de nivel înalt ar trebui traduse în unele • іПіііѵю pentru toate formele intermediare - nivelul arhitecturii setului de instrucțiuni; Software-ul ііііпіаratnos este orientat spre implementarea directă a pro-іrііmmm de acest nivel Stratul de arhitectură a setului de instrucțiuni leagă compilatoare și hardware Este un limbaj pe care atât compilatorii, cât și dispozitivele îl înțeleg • pm Pe fig Figura arată relația dintre compilatoare, nivelul arhitecturii setului de instrucțiuni și hardware Programul FORTRAN Program în limbaj C Programul FORTRAN compilat ѵ în instrucțiunile mașinii Programul C compilat în instrucțiunile mașinii Nivelul arhitecturii set de instrucțiuni Software Un program din instrucțiunile mașinii este executat de firmware sau hardware Hardware Hardware Orez Stratul de arhitectură al setului de instrucțiuni este o legătură intermediară între compilatoare și hardware ilva o nivelul de arhitectură al comenzilor HBOOS În mod ideal, atunci când proiectează o nouă mașină, designerii de arhitectură CCM ar trebui să se consulte cu dezvoltatorii de compilatori și hardware pentru a determina ce caracteristici ar trebui să aibă stratul de sub jurisdicția lor Dacă dezvoltatorii compilatorului cer o proprietate pe care inginerii nu o pot implementa la un nivel acceptabil de cost (să zicem, un salt necondiționat cu un bonus pentru programator), atunci această idee va trece În același mod, dacă designerii de hardware doresc să adauge un nou element complicat la computer (de exemplu, memorie cu acces ultra-rapid la adrese care sunt numere prime dar programatorii nu vor putea scrie un program care să-l suporte, proiectul TLAM nu se va concretiza niciodată Implementarea end-to-end a nivelului de arhitect al setului de instrucțiuni, optimizat pentru limbajele de programare dorite, este întotdeauna produsul multor discuții și modelări Dar toate acestea sunt în teorie Acum să trecem la realitatea dură Când este anunțată o nouă mașină, prima întrebare pe care și-o pun toți potențialii scăldatori IW este: "Este mașina compatibilă cu retroactiv?" A doua întrebare este "Pot rula vechiul sistem de operare pe el?" Iar al treilea VM a întrebat: "Vor funcționa vechile aplicații pe această mașină și va necesita(tm) să fie înlocuite cu versiuni noi?" Dacă răspunsul la oricare dintre aceste întrebări este ok|| este numit negativ, dezvoltatorii vor trebui să facă argumente foarte convingătoare Este puțin probabil ca clienții să vrea să-și arunce programele preferate pentru a începe de la capăt Acest fapt îi obligă pe producătorii de computere să accepte același nivel de instrucție în diferite modele, sau cel puțin să-l facă reversibil Prin compatibilitate inversă, înțelegem capacitatea unei mașini noi de a rula programe vechi fără modificări În același timp, noua mașină poate accepta comenzi noi și poate avea alte caracteristici pe care le utilizează noul software Dezvoltatorii trebuie să facă nivelul de comandă compatibil cu înapoi, dar sunt liberi să schimbe hardware-ul după bunul plac, deoarece aproape niciunuia dintre cumpărători îi pasă de ce sunt cu adevărat "interiorurile" computerului și ce anume face acest sau acel dispozitiv Dezvoltatorii pot trece de la firmware la utilizarea directă a dispozitivelor, pot adăuga conducte, pot implementa circuite superscalare și așa mai departe, dar cu condiția ca acestea să rămână compatibili cu nivelul de instrucțiuni al modelelor anterioare Scopul principal este să vă asigurați că programele vechi funcționează pe noua mașină Adică, sarcina iese în prim-plan nu doar de a crea mașini bune, ci de a crea mașini bune, cu condiția să fie compatibile cu invers Toate cele de mai sus nu scad de la importanța stratului de arhitectură a setului de instrucțiuni Nivelul de calitate al arhitecturii setului de instrucțiuni este extrem de important, mai ales în ceea ce privește capacitățile de calcul și costul Performanța mașinilor echivalente cu diferite niveluri de arhitectură a seturilor de instrucțiuni poate diferi cu % Vrem doar să spunem că piața îngreunează într-o anumită măsură trecerea de la vechea arhitectură de echipă la cea nouă Cu toate acestea, uneori apar noi niveluri de comenzi de uz general și pe piețele specializate (de exemplu, pe piața pentru i nі іgm sau pe piața procesoarelor multimedia), ele apar mult mai des Nu vreau să spun, este important să înțelegeți cum funcționează acest strat Ce este o arhitectură de comandă bună? Există doi factori principali În primul rând, o arhitectură bună ar trebui să definească un set de instrucțiuni care pot fi implementate eficient nu numai în tehnologia modernă, ci și în tehnologia viitoare Cu o arhitectură de instrucțiuni prost proiectată, procesorul poate fi construit cu mai multe porți, mai multă memorie poate fi folosită pentru a executa programe etc Poate rula și mai lent, cu excepția cazului în care arhitectura setului de instrucțiuni ascunde posibilitatea executării paralele a operațiunilor și mai complexe sunt necesare scheme pentru a obține performanțe echivalente Un design care ține cont în mod corespunzător de dezavantajele unei anumite tehnici poate deveni baza pentru producția unei întregi linii de calculatoare, care poate fi înlocuită cu un sistem cu o arhitectură de instrucțiuni și mai ingenioasă În al doilea rând, o arhitectură de instrucțiuni bună ar trebui să ofere cunoștințele supreme despre care ar trebui să fie exact procesul compilat Claritatea și completitudinea opțiunilor sunt caracteristici care nu sunt întotdeauna caracteristice arhitecturii de comandă Aceste trăsături sunt deosebit de importante pentru un compilator care nu poate face cea mai bună alegere dintre mai multe alternative, în special în і і /і și unele alternative aparent evidente nu sunt acceptate de arhitectura de instrucțiuni Pe scurt, din moment ce stratul de arhitectură al setului de instrucțiuni este o legătură intermediară între arhitectura hardware și software, ar trebui să satisfacă atât dezvoltatorii hardware (în ceea ce privește implementarea eficientă), cât și programatorii (în ceea ce privește software-ul de generare de cod bun) Prezentare generală a nivelului arhitecturii setului de instrucțiuni Să începem studiul nostru asupra stratului arhitecturii setului de instrucțiuni întrebând ce este acesta Această întrebare la prima vedere poate părea simplă, dar de fapt există o mulțime de subtilități În următoarea subsecțiune, vom discuta unele dintre acestea și apoi vom analiza modelele de memorie, registru și instrucțiuni Set de instrucțiuni Proprietăți la nivel de arhitectură În principiu II, nivelul arhitecturii setului de instrucțiuni este nivelul la care computerul este prezentat programatorului care scrie programe la vârful mașinii Deoarece niciun programator normal nu scrie acum astfel de programe, am reelaborat ușor această definiție: un program la nivel de arhitectură de set de instrucțiuni este ceea ce compilatorul produce ca rezultat al lucrării (și deocamdată nu vom atinge apelurile de sistem și asamblatorul simbolic și de vârf) Pentru a obține un program la nivel de arhitectură de set de instrucțiuni, redactorul compilatorului trebuie să știe ce model de memorie este utilizat w /rivѵn" comenzi ardit ѵkturvy WWtJQpi în mașină, ce registre, tipuri de date și instrucțiuni sunt disponibile Toate aceste informații împreună determină nivelul arhitecturii instrucțiunilor În conformitate cu această definiție, întrebările despre dacă arhitectura MIS este accesibilă programatic, dacă computerul este pipeline, superscalar etc , nu aparțin nivelului de arhitectură al setului de instrucțiuni, deoarece dezvoltatorul compilatorului nu vede toate acestea Cu toate acestea, această remarcă este doar parțial adevărată; unele dintre aceste caracteristici afectează debitul - un indicator care este destul de accesibil dezvoltatorului compilatorului Luați în considerare, de exemplu, o mașină superscalară care procesează instrucțiuni duble într-un ciclu și astfel încât o instrucțiune este un întreg întreg, iar a doua este un instrucțiune în virgulă mobilă Dacă instrucțiunile întregi și în virgulă mobilă sunt intercalate în codul rezultat din slave compilatorului, atunci performanța va crește considerabil Astfel, operația superscalară deNAM este disponibilă la nivelul de arhitectură a setului de instrucțiuni D, granițele dintre diferitele niveluri sunt neclare cic Pentru unele arhitecturi, nivelul de instruire este definit printr-un document formal, care este de obicei emis de un consorțiu industrial, dar pentru altele nu este De exemplu, ARM v (versiunea a ARM ISA) are o definiție oficială publicată de ARM Ltd Scopul unui astfel de document oficial este de a oferi posibilitatea diferiților producători de a produce mașini de acest tip, astfel încât mașinile VYa să poată executa aceleași programe și, în același timp, să primească SDS | si aceleasi rezultate j In cazul ARM, astfel de documente sunt necesare pentru a fi diferit! întreprinderile ar putea produce cipuri ARM identice, care diferă unele de altele doar prin performanță și preț Pentru ca această idee să funcționeze, vânzătorii de cipuri trebuie să știe ce face un cip ARM (la nivelul arhitecturii setului de instrucțiuni) Prin urmare, documentul vorbește despre ce este modelul de memorie, ce registre sunt disponibile, ce fac instrucțiunile etc , nu despre ce este microarhitectura Astfel de documente conțin secțiuni normative care stabilesc cerințele și secțiuni informative menite să ajute cititorul, dar nu fac parte din definiția formală În secțiunile normative, există în mod constant cuvinte care ar trebui, nu ar trebui, nu ar trebui, însemnând, respectiv, o cerință, o interdicție și o recomandare De exemplu, următoarea propoziție înseamnă că, dacă un program execută un cod operațional care nu este definit, OH ar trebui să provoace o capcană, nu doar să fie ignorat: Executarea unui cod operațional rezervat trebuie să declanșeze o capcană Poate exista o abordare alternativă: Rezultatul executării unui cod operațional rezervat este definit de implementare Aceasta înseamnă că designerul compilatorului nu se poate baza pe niciun comportament anume; prin urmare, dezvoltatorii au libertatea de a alege Descrierile arhitecturii sunt adesea însoțite de pachete de testare pentru a verifica dacă implementarea îndeplinește de fapt specificația Este foarte clar de ce ARM v vine cu un document care citește nivelul de arhitectură al setului de instrucțiuni care este necesar, astfel încât ambele cipuri ARM să poată executa aceleași programe De mulți ani, a existat documentul definitoriu І'irmіі'іyіоgo pentru arhitectura setului de instrucțiuni ІА- іn mKY) - Intel nu dorea ca alți producători să poată produce cipuri compatibile cu Intel Ea a făcut chiar apel la n și n să interzică producția de microcircuite de către alți producători, ♦іn a pierdut procesul Cu toate acestea, la sfârșitul anilor , Intel a publicat specificația ♦■♦ ІІ'іpuyu pentru setul de instrucțiuni IA- Fie că și-a dat seama de eroarea abordării sale și a vrut să-și ajute colegii designeri și programatori, a fost pentru că SUA, Japonia și Europa au decis să testeze Intel pentru legile monopolului O referință bine scrisă la setul de comenzi Intel este găsită și continuă să fie actualizată pe site-ul web Intel și dezvoltatori {http://developer intel com) Volumul versiunii cu comenzi Intel i nіg i este de de pagini; aceasta ne reamintește încă o dată că i " u i se referă la calculatoare cu un set de instrucțiuni complex O altă calitate importantă a nivelului arhitecturii setului de instrucțiuni este că cel puțin două moduri sunt acceptate pe majoritatea mașinilor Modul privilegiat II pornește sistemul de operare Acest mod nu va permite executarea tuturor comenzilor Modul utilizator este destinat programelor de aplicație huiu ka Nu permite executarea unor comenzi potențial periculoase (de exemplu, cele care manipulează direct ♦< sau memoria) În acest capitol, ne vom concentra în primul rând pe comenzile și funcțiile modului utilizator Modele de memorie Dar în calculatoarele iisx, memoria este împărțită în celule care au succesive III 'іыіыс adrese În prezent, cea mai comună dimensiune a celulei este M mare, dar au fost utilizate anterior celule de la la de biți (a se vedea Tabelul ) O celulă și і K biți se numește octet (sau octet) Motivul pentru utilizarea celulelor de memorie de biți este că un caracter ASCII ia biți, deci niciunul (aveți cu un bit de paritate rar folosit) nu se potrivește într-un octet II alte codificări, cum ar fi Unicode și UTF- , folosesc grupuri de biți care sunt multipli de pentru a reprezenta simbolul Albii sunt de obicei grupați în cuvinte de octeți ( de biți) sau de octeți (biți II), iar instrucțiunile pentru manipularea cuvintelor întregi sunt prezente în set Multe arhitecturi necesită cuvinte pentru a se alinia pe propriile limite Astfel, un cuvânt de octeți poate începe la adresa , , etc , dar nu la adresa sau În mod similar, un cuvânt de octeți poate începe la adresa , sau , dar nu la adresa sau Mecanismul de alocare a і 'іov de octeţi în memorie este ilustrat în fig Alinierea adreselor este necesară destul de des, deoarece este cea mai eficientă modalitate de utilizare a memoriei De exemplu, un procesor Coge I care apelează octeți de memorie prin interfața DDR acceptă doar accesări aliniate la biți Prin urmare, Cope I nu va putea accesa deloc memoria nealiniată, deoarece interfața de memorie necesită ca adresele să fie multipli de Abordare octeți i ! i • • • II | іz f ț | - ' " DESPRE Cuvânt aliniat de octeți la adresa celulei A Abordare octeți І DESPRE Cuvânt nealiniat de octeți la adresa celulei Orez Locația cuvântului de octeți în memorie: cuvânt(e) aliniat(e); cuvânt nealiniat (b) Unele mașini necesită ca cuvintele să fie aliniate în memorie Cu toate acestea, cerința pentru alinierea adresei cauzează uneori unele probleme În procesorul Cope I , programele pot accesa fișiere începând de la orice adresă, o calitate care se întoarce la cu o magistrală de date de octet care nu necesita ca celulele să se afle pe granițele de octeți Dacă un program dintr-un procesor Core i citește un cuvânt de octeți de la adresa , hardware-ul trebuie să facă un acces de memorie* pentru a apela octeții de la la și un al doilea apel la octeții de la la Apoi CPU preia cei octeți necesari din citesc din memorie și le aranjează în ordinea corectă pentru a forma un cuvânt de octeți Este clar că executarea frecventă a unor astfel de operațiuni nu merge bine cu performanțe ridicate Capacitatea de a citi cuvinte cu adrese arbitrare necesită complexitatea cipului, care devine apoi mai mare și mai scump Dezvoltatorii ar fi bucuroși să scape de un astfel de cip și ar cere pur și simplu ca toate programele să acceseze memoria cuvânt cu cuvânt, nu octet cu octet Cu toate acestea, la întrebarea tradițională a dezvoltatorilor: "Cine are nevoie de programe vechi scrise pentru mașini și complet greșit cu memoria?" - urmează răspunsul nu mai puțin tradițional al vânzătorilor: "Către clienții noștri" Majoritatea mașinilor au un singur spațiu de adrese liniar care merge de la adresa la un maxim, de obicei sau de octeți Unele mașini au spații de adrese separate pentru instrucțiuni și date, astfel încât un apel de instrucțiuni la adresa și un apel de date la adresa se referă la spații de adrese diferite Un astfel de sistem este mult • -ishmnt decât un singur câmp de adresă, dar are două avantaje În primul rând, toate cu aceleași adrese de de biți, apare posibilitatea de NMі'іb octeți pentru programe și a altor de octeți pentru date În al doilea rând, "copiarea nm are loc întotdeauna automat numai în spațiul de date (și suprascrierea programului ivy devine imposibilă și, prin urmare, una dintre sursele erorilor software este, de asemenea, eliminată În cele din urmă, separarea datelor knііdі complică atacurile de programele rău intenționate pe care le pot schimba codul programului - nici măcar nu îl pot adresa (Rețineți că spațiile de adrese separate pentru instrucțiuni și date nu sunt aceleași cu un cache L partajat În primul caz, întregul spațiu de adrese este duplicat, iar citirea de la oricare adresă va produce rezultate diferite în funcție de ceea ce este citit exact: slo -іш /інн sau comandă Cu un cache împărțit, există un singur "і/і|іі" (fără * spațiu, doar diferite "іш ін din acest spațiu sunt stocate în blocuri cache diferite Un alt aspect al modelului memoriei este semantica memoriei Este firesc să ne așteptăm ca comanda LOAD, dacă este executată după comanda STORE, să meargă la acea adresă și să returneze valoarea doar stocată Totuși, așa cum am văzut în Capitolul , microinstrucțiunile sunt reordonate pe multe mașini Astfel, există un pericol real ca memoria să nu funcționeze așa cum este dată Situația devine mai complicată în prezența unui multiprocesor, când fiecare procesor trimite un flux de cereri de citire și scriere în memoria partajată, iar aceste iairos pot fi și reordonate Proiectanții de sistem au mai multe opțiuni pentru a rezolva această problemă Pe de o parte, toate cererile de memorie pot fi ordonate în așa fel încât fiecare să fie finalizată înainte de a începe următoarea Această strategie are un efect negativ asupra performanței, dar va oferi cea mai simplă semantică a memoriei (toate operațiunile sunt efectuate strict în ordinea în care sunt localizate în program) (Pe de altă parte, nu puteți face deloc garanții cu privire la ordonarea solicitărilor de memorie, iar pentru a realiza o astfel de ordonare, programul execută comanda SYNC, care blochează lansarea tuturor operațiunilor noi de memorie până la finalizarea celor anterioare Aceasta ideea este foarte dificilă Dezvoltatorii de compilatori trebuie să muncească din greu pentru că trebuie să înțeleagă cu atenție cum funcționează microarhitectura corespunzătoare, dar dezvoltatorilor de hardware li se oferă libertate deplină în ceea ce privește optimizarea utilizării memoriei Sunt posibile și modele de memorie intermediară, în care hardware-ul blochează automat începerea anumitor operațiuni de memorie (de exemplu, cele asociate cu interdependențe RAW și WAR), fără a bloca în același timp începerea tuturor celorlalte operațiuni Deși implementarea acestor caracteristici la nivelul arhitecturii setului de instrucțiuni este destul de plictisitoare (cel puțin pentru scriitorii de compilatori și programatorii de limbaje de asamblare), există acum o tendință notabilă către prevalența acestei abordări Această tendință este stimulată de dezvoltări precum mecanismele de reordonare a microinstrucțiunilor, conductele, cache-urile pe mai multe niveluri și așa mai departe Alte exemple mai puțin cunoscute de acest gen vor fi discutate mai târziu în acest capitol Registrele Toate calculatoarele au mai multe registre disponibile la nivelul d|i al arhitecturii setului de instrucțiuni Acestea vă permit să controlați execuția programului, să stocați rezultate temporare și sunt, de asemenea, utilizate în alte scopuri De obicei, registrele disponibile la nivel de microarhitectură (cum ar fi TOS și MAR în Figura ) nu sunt disponibile la nivelul arhitecturii setului de instrucțiuni, dar registre precum contorul de program și pointerul de stivă sunt disponibile la ambele niveluri În același timp, registrele accesibile la nivelul arhitecturii setului de comenzi sunt întotdeauna disponibile la nivel de microarhitectură, deoarece acolo sunt rgnizate Registrele de nivel de arhitectură setului de instrucțiuni pot fi împărțite în două categorii: registre speciale și registre de uz general Registrele speciale includ contorul de programe și indicatorul de stivă, precum și alte registre care au funcții speciale Registrele de uz general conțin chei, variabile locale și rezultate intermediare ale calculelor Funcția lor principală este de a oferi acces rapid la datele utilizate frecvent (de obicei fără acces la memorie) Mașinile RISC cu procesoare rapide și memorie (relativ) lentă conțin de obicei cel puțin de registre de uz general, numărul de registre de uz general crescând constant la procesoarele mai noi În unele mașini, registrele de uz general sunt complet simetrice și interschimbabile Dacă toate registrele sunt echivalente, compilatorul poate folosi atât registrul R , cât și registrul R pentru a stoca rezultatul intermediar Alegerea registrului nu contează Pe alte mașini, unele registre de uz general pot fi specializate De exemplu, procesorul Core i are un registru EDX care poate fi folosit ca registru de uz general, dar care, în plus, este folosit pentru a rezolva probleme foarte specifice (ia jumătate din produs la înmulțire și jumătate din dividend la împărțire) Chiar dacă registrele de uz general sunt complet interschimbabile, sistemul de operare sau compilatoarele urmează adesea convenții formale pentru utilizarea lor De exemplu, unele registre pot fi folosite pentru a stoca parametrii procedurilor apelate, în timp ce altele sunt temporare Dacă compilatorul plasează o variabilă locală importantă în registrul R și apoi apelează o procedură de bibliotecă care tratează R ca pe o procedură alocată temporar în registru R poate rămâne "gunoi" Adică dacă exist! orice convenție de sistem pentru utilizarea registrelor trebuie să fie urmată de scriitorii de compilatori și programatorii de asamblare Pe lângă registrele disponibile la nivelul arhitecturii setului de instrucțiuni, există întotdeauna destul de puține registre speciale disponibile doar în modul privilegiat Aceste registre controlează diverse blocuri cache, memoria principală, dispozitivele I/O și alte dispozitive ale mașinii Aceste registre sunt utilizate numai de sistemul de operare, astfel încât compilatorii și utilizatorii nu trebuie să știe despre existența lor, Și/uni Registrul "hibrid" este disponibil atât în modul privilegiat, cât și în modul zero Acesta este registrul PSW (Program State Word), care se mai numește și registrul flag Registrul flag conține diferiții biți necesari CPU Cei mai importanți biți sunt biții condiționali Ele sunt setate în fiecare ciclu ALU și reflectă starea operației anterioare: ♦ N rezultat este negativ (Negativ); ♦ / rezultatul este (Zero); ♦ Rezultatul V a provocat un overflow (oVerflow); ♦ (' purta bitul din stânga (efectuează); ♦ A carry bit (Auxiliary carry); Rezultatul R este par (Paritate) Codurile de condiție sunt foarte importante deoarece sunt folosite în comparații și salturi condiționate De exemplu, instrucțiunea CMP scade de obicei un operand din altul și stabilește coduri de condiție pe baza diferenței Dacă operanzii sunt în regiune, atunci diferența va fi egală cu , iar bitul Z va fi setat în registrul steag Următoarea instrucțiune BEQ (Branch Equal - branch in case of equality) pro-ngează bitul Z și ia ramura daca este setata Un registru mat poate stoca mai mult decât coduri de stare Conținutul său și mașinile de sacristie pot fi diferite Câmpurile suplimentare indică modul (de exemplu, utilizator sau privilegiat), bit de urmărire (care este utilizat pentru depanare), nivelul de prioritate a procesorului, starea întreruperii Registrul steag este de obicei citit în pi'*pm(') al utilizatorului, dar unele câmpuri pot fi scrise doar în pi'*pm(' privilegiat (de exemplu, bitul care specifică modul) Echipe Cea mai mare caracteristică a nivelului pe care îl luăm în considerare acum este setul de instrucțiuni ale mașinii Ei controlează acțiunile mașinii În acest set, există întotdeauna, în mii sau într-o altă formă, comenzile LOAD și STORE, destinate mutarii datelor între memorie și registre, și comanda MOVE, care este străină pentru copierea datelor dintr-un registru în altul De asemenea, întotdeauna cu -і ѵг< comenzi aritmetice și logice, comenzile pentru compararea elementelor de ordine și comenzile pentru tranziții, în funcție de rezultate, sunt îndoite Câteva comenzi tipice au fost deja discutate în Capitolul (vezi Tabelul ), iar în acest capitol vom întâlni multe altele Prezentare generală a nivelului de arhitectură al setului de instrucțiuni COGE i În capitolul II, vom discuta trei arhitecturi de instrucțiuni complet diferite: Intel IA- (implementat în Cohr i ), ARM V (implementat în sistemul cu un singur cip OMAP ) și arhitectura AVR pe biți utilizată de microcontrolerul ATmegal Nu este intenția noastră să oferim o descriere exhaustivă a fiecăreia dintre aceste arhitecturi Vrem doar să demonstrăm aspecte importante ale arhitecturii de comandă și să arătăm cum se schimbă aceste aspecte de la o arhitectură la alta Să începem cu aparatul Coge I si Nv /' Procesorul Coge I a evoluat de-a lungul anilor După cum s-a menționat în Capitolul , istoria sa merge înapoi la cele mai vechi microprocesoare Arhitectura de bază de instrucțiuni permite executarea de programe scrise pentru procesoarele și (care au aceeași arhitectură de instrucțiuni) și parțial chiar și pentru , un procesor pe biți care era popular în anii , la rândul său, a fost puternic influențat de cerința de a fi compatibil cu procesorul , care se baza pe procesorul (un cip pe biți datând din epoca de piatră) Din punct de vedere software, computerele și erau pe biți (deși computerul conținea o magistrală de date pe biți) Succesorul lor, , era, de asemenea, pe biți Principalul său avantaj a fost un spațiu de adrese mai mare, deși foarte puține programe l-au folosit pentru că era format din de segmente de de kiloocteți, mai degrabă decât din memorie liniară de de octeți Procesorul a fost prima mașină pe de biți lansată de Intel Toate procesoarele ulterioare ( , Pentium, Pentium Pro, Pentium II, Pentium III, Pentium , Celeron, Cheop, Pentium M, Centrino, Cope duo, Cope I etc ) au exact aceeași arhitectură pe de biți, adică numit IA- , așa că ne vom concentra atenția asupra acestei arhitecturi Singura schimbare majoră de arhitectură de la a fost introducerea instrucțiunilor MMX, SSE și SSE în versiunile ulterioare x Aceste comenzi foarte specializate îmbunătățesc performanța aplicațiilor multimedia O altă adăugare importantă a fost extensia x pe de biți (denumită adesea x - ), care crește dimensiunea datelor întregi și a adreselor virtuale la de biți Deși majoritatea extensiilor au fost introduse mai întâi de Intel și ulterior implementate de concurenți, această extensie a fost introdusă inițial de AMD Coge i are moduri de operare, din care două funcționează ca un În modul real, toate funcțiile cu care procesorul a fost dotat de la sunt dezactivate, iar Coge i funcționează ca un simplu procesor În în cazul unei erori software, are loc o defecțiune completă a sistemului Dacă Intel ar dezvolta ființe umane, atunci cu siguranță s-ar pune un pic special în interiorul fiecărei astfel de creaturi, readucerea unei persoane la modul de funcționare al strămoșilor săi (creier primitiv, lipsă de vorbire, viață în copaci, o dietă pur cu banane etc ) Următorul pas este modul procesor virtual v, care face posibilă rularea programelor vechi scrise pentru (software protejat Pentru a rula vechiul program , sistemul de operare creează un mediu izolat special care funcționează ca un procesor , dacă presupunem că atunci când un utilizator Windows deschide o fereastră MS-DOS, programul care rulează în acea fereastră rulează în modul procesor virtual pentru a proteja Windows de posibilele libertăți ale programelor DOS Ultimul mod este modul protejat, în care Coge i se comportă mai degrabă ca un Coge i decât ca un foarte scump În acest mod, sunt disponibile niveluri de privilegii, setate de biții din registrul flag (PSW) Nivelul corespunde Activați modul privilegiat pe alte computere și oferiți acces complet la mașină Acest nivel este utilizat de sistemul de operare Nivelul este pentru programele utilizatorului La acest nivel, blocurile au acces la anumite comenzi și registre de control, astfel încât eșecul unui program utilizator nu duce la prăbușirea întregului sistem Nivelurile și sunt rar utilizate Coge i are un spațiu de adrese uriaș Memoria este împărțită în de segmente, fiecare dintre acestea ocupând adrese de la la - Cu toate acestea, majoritatea sistemelor de operare (inclusiv UNIX și toate versiunile de Windows) acceptă doar un singur segment, astfel încât un spațiu de adrese liniar de de octeți este de obicei disponibil pentru programe de aplicație, uneori o parte din acest domeniu este ocupată de sistemul de operare însuși Fiecare octet din spațiul de adrese are propria sa adresă Cuvintele au de biți Octeții sunt numerotați de la dreapta la stânga (adică prima adresă corespunde octetului cel mai puțin semnificativ) Registrele procesorului Core i sunt prezentate în fig Primele patru registre I;LX, EBX, ECX și EDX sunt pe de biți Acestea sunt totuși registre de uz general Orez Principalele registre ale procesorului Core i fiecare dintre ele are anumite caracteristici Registrul aritmetic principal EAX; EBX este conceput pentru a stoca pointeri (adrese de memorie); ECX este despre ciclism; EDX este necesar pentru înmulțire și împărțire Acest registru, împreună cu EAX, conține produse și dividende pe de biți Mladnіig și biți în fiecare dintre registrele considerate sunt * ' registre independente de și, respectiv, biți, permițându-vă să manipulați cu ușurință * valorile de și biți În calculatoarele și există doar registre de și biți, registrele de de biți au apărut în sistemul MSI împreună cu prefixul E (Extended - extins) Următoarele trei registre sunt și registre de uz general, dar cu un grad mai mare de specializare Registrele ESI și EDI sunt concepute pentru a stoca pointeri și sunt concentrate în principal pe suport hardware pentru comenzile șir: ESI indică șirul sursă, EDI către șirul țintă, registrul IV în mașina IJVM Un astfel de registru este denumit în mod obișnuit indicator de cadru În cele din urmă, registrul ESP este indicatorul stivei Următorul grup de registre de la CS la GS sunt registre de segment Aceștia sunt "trilobiți electronici" - atavisme rămase de la procesorul , care avea de octeți de memorie disponibili prin adrese pe biți Este suficient să spunem că atunci când Coge i rulează în modul de spațiu de adresă liniar unic de de biți, acestea pot fi ignorate în siguranță Registrul EIP (Extended Instruction Pointer) este un contor de program Registrul EFLAGS este un registru steag Prezentare generală a nivelului arhitecturii setului de instrucțiuni OMAP I Arhitectura ARM a fost introdusă pentru prima dată în de Acron Computers Sa bazat pe un studiu efectuat la Berkeley în anii [Patterson, ; Patterson și Serquin, ] Arhitectura originală ARM (numită ARM ) era pe de biți și suporta un spațiu de adrese de de biți OMAP folosește microarhitectura ARM Cortex A , care implementează versiunea a arhitecturii ARM și asta vom descrie în acest capitol Pentru coerență cu restul cărții, ne vom referi la acest sistem ca OMAP , deși la nivelul arhitecturii setului de instrucțiuni, toate mașinile bazate pe ARM Cortex A sunt identice Structura de memorie a mașinii TMAP este foarte simplă - o matrice liniară de de octeți Sunt acceptate ambele tipuri de numerotare de octeți (înainte și înapoi); tipul de numerotare este setat în blocul de memorie de sistem, al cărui conținut este citit imediat după resetarea procesorului Pentru ca un bloc de memorie să fie citit corect, acesta trebuie să fie în little-endian endian, chiar dacă mașina este setată pe big-endian Este important ca limita de octeți adresabili să fie mai mare decât ceea ce este necesar pentru implementarea arhitecturii de instrucțiuni, deoarece în viitor este probabil ca cantitatea de memorie care poate fi accesată de procesor să fie nevoie să fie mărită Spațiul de adrese ARM pe de biți provoacă deja probleme dezvoltatorilor, și arhitectura de nivel oeeor nvoirv kimshm ^■Știu că multe sisteme bazate pe ARM (cum ar fi smartphone-urile) au mai mult de MB de memorie Acum, pentru a rezolva această problemă, designerii real-Mri* folosesc o mare parte a memoriei sub forma unei unități flash, pentru a lucra cu care folosesc o interfață de disc cu suport pentru un spațiu ■parte mai mare orientat pe blocuri Pentru a aborda această limitare (eretică care dăunează vânzărilor), ARM a omis recent definiția arhitecturii setului de instrucțiuni ARM versiunea cu suport pentru spațiile de adrese B-row Una dintre cele mai mari probleme este că arhitectura de instrucțiuni limitează dimensiunea memoriei adresabile În tehnologia computerelor, singura problemă pentru care nu există o soluție este lipsa ■Tone Într-o zi, nepoții noștri se vor întreba cum ar putea funcționa computerele cu adrese de doar de biți și GB de memorie atunci când computerul mediu are nevoie de cel puțin un terabyte pentru a rula p Arhitectura instrucțiunilor ARM este destul de simplă, deși organizarea registrelor LM este puțin complicată pentru a face apelurile de procedură mai eficiente În această arhitectură, contorul programului este mapat la fișierul de registru fshs (registrul R ), deoarece acest lucru vă permite să creați tranziții cu operațiuni ALU al căror registru de recepție este R Practica arată că o astfel de scalare a registrului creează mai multe probleme decât aduce beneficii, dar cerințele de compatibilitate inversă nu permit să fie abandonată Arhitectura ARM are două grupuri de registre: registre de uz general pe de biți și de registre în virgulă mobilă pe de biți (dacă este acceptat coprocesorul VFP) Registrele de uz general R -R , dar alte denumiri sunt folosite în anumite contexte Variantele denumirilor registrelor și funcțiile acestora sunt date în tabel Tabelul Registre de uz general în ARM versiunea Înregistrare Nume alternativ Scop KO R A -A Conțin parametrii procedurii apelate R R VI-V Conțin variabile locale pentru procedura curentă R IP In-Procedural Call Register (pentru apeluri pe de biți) R SP Stack Pointer Registrul R LR Link (adresă de returnare pentru funcția curentă) R Contor de programe PC Toate registrele de uz general sunt pe de biți; toate pot fi citite și scrise prin diferite comenzi de încărcare și stocare Scopul acestor registre, prezentat în tabel , parțial determinat prin convenție, parțial dependent de hardware-ul utilizat Cu toate acestea, în general, nu ar trebui să vă abateți de la sarcina specificată, cu excepția cazului în care sunteți un mare expert în computerele ARM Programatorul trebuie să se asigure că programul accesează corect registrele și efectuează operații aritmetice valide cu acestea De exemplu, este foarte ușor să încărcați numere flotante indicați în registrele de uz general, apoi efectuați o adăugare de numere întregi pe ele - o operație care va duce la o prostie totală, pe care procesorul central o va efectua cu siguranță dacă programul o cere Registrele Vx sunt folosite pentru a stoca constante, variabile și pointeri care sunt necesare în toate procedurile, deși pot fi încărcate și reîncărcate la intrarea și ieșirea din procedură, după cum este necesar Registrele Ax sunt folosite pentru a transmite parametri la proceduri pentru a evita accesul la memorie În continuare, vom descrie cum se întâmplă acest lucru Patru registre speciale sunt folosite în scopuri speciale Registrul IP vă permite să ocoliți limitările instrucțiunii de apelare a funcției ARM (BL), care nu poate adresa toți cei de octeți ai spațiului de adrese Dacă adresa țintă este prea departe de instrucțiune, atunci instrucțiunea apelează un fragment de cod special i care transferă controlul către adresa din registrul IP Registrul SP indică partea superioară curentă a stivei și se schimbă atunci când cuvintele sunt împinse sau scoase din stivă Al treilea registru special, LR, conține adresa de retur pentru procedura curentă Cel de-al patrulea registru special - RS - a fost deja menționat aici; când valoarea este stocată în acest registru, preluarea instrucțiunii este redirecționată către adresa specificată Un alt registru important din arhitectura ARM, Program Status Register sau PSR, conține informații despre starea tuturor calculelor anterioare ALU În special, printre bitonii săi există semne de zero, valoare negativă și preaplin Arhitectura ARM (cu coprocesorul VFP) are și de registre pe de biți Aceste registre pot fi accesate fie ca de valori reale cu precizie unică, fie ca valori reale cu precizie dublă pe de biți Mărimea registrului este determinată de instrucțiune; practic toate instrucțiunile cu virgulă mobilă din ARM există atât în variante de precizie simplă, cât și în variante dublă Arhitectura ARM aparține categoriei de arhitecturi de încărcare și stocare Aceasta înseamnă că singurele instrucțiuni care accesează direct memoria sunt LOAD (încărcare) și STORE (salvare), care asigură mișcarea datelor între registre și memorie Toți operanzii pentru instrucțiunile aritmetice și logice trebuie să fie preluați din registre sau furnizați de instrucțiunea în sine (fără acces la memorie), iar toate rezultatele trebuie stocate în registre (dar nu în memorie) Prezentare generală la nivel de arhitectură a setului de instrucțiuni ATmegal Ca un al treilea exemplu, vom lua în considerare cipul ATmegal Spre deosebire de procesoarele COGE I (care sunt utilizate în principal în computerele desktop și fermele de servere) și OMAP (care se găsesc în principalele telefoane, tablete și alte dispozitive mobile), Cipurile ATmegal sunt utilizate de obicei în sistemele încorporate cu performanță scăzută (de la lumini stradale la ceasuri cu alarmă) pentru a procesa semnalele de la butoane, lumini indicatoare și alte elemente ale interfeței cu utilizatorul Această subsecțiune oferă o scurtă descriere tehnică a ATmegal și a microcircuitelor aferente Prezentare generală a nivelului de arhitectură al comenzilor myoori ► ATmegal funcționează într-un singur mod și nu are hardware MCIT Nu sunt necesare - la urma urmei, nu execută niciodată simultan programe non-IPlic, dintre care unul poate fi rău intenționat Modelul de memorie al lui Tsn ychayno este simplu Există Kbytes de memorie de program și Kbytes de memorie OTHERS Aceste spații sunt separate astfel încât o adresă se poate referi la diferite locații de memorie, în funcție de faptul că adresa se referă la zona bish sau la zona programului Separarea spațiilor de memorie face posibilă rInilizarea spațiului programului în ROM și a spațiului de date în RAM * Sunt posibile mai multe variante de implementare a memoriei, în funcție de suma pe care designerul este de acord să plătească pentru procesor Cea mai simplă versiune III (ATmega ) oferă KB de memorie flash pentru programe ȘI octeți de RAM pentru date Atât memoria flash, cât și memoria RAM sunt găzduite în același pachet de cipuri Având în vedere zona de aplicație, această cantitate de memorie este de obicei destul de suficientă, iar co-locarea procesorului și a două module de memorie este considerată un avantaj serios În modelul ATmega , capacitatea ambelor module este dublată: KB de ROM și KB de RAM ATmegal folosește o organizare a memoriei pe două niveluri pentru a îmbunătăți memoria programului ROM-ul programului este împărțit într-o secțiune de bootloader și o secțiune de aplicație; dimensiunile secțiunilor sunt determinate de biți care sunt programați o singură dată la momentul primei surse de alimentare a microcontrolerului Din motive de securitate, memoria flash poate fi actualizată doar cu cod din secțiunea bootloader, datorită acestei caracteristici, cod plasat în secțiunea aplicație (inclusiv aplicațiile de la terți descărcate) pot fi rulate cu încredere deplină că nu va interfera cu munca altui cod de pe sistem (deoarece acest cod va fi executat într-un spațiu de aplicație din care scrierea în memoria flash nu este posibilă) Pentru a elimina complet orice excese, furnizorul poate furniza codului o semnătură electronică În acest caz, încărcătorul va încărca codul în memoria flash numai dacă este semnat de un furnizor aprobat, ceea ce înseamnă că codul va rula pe sistem numai cu "binecuvântarea" unei surse de încredere Soluția se dovedește a fi destul de flexibilă: vă permite chiar să înlocuiți bootloader-ul dacă noul cod are semnătura electronică corectă Apple și TV folosesc o metodă similară pentru a securiza codul care rulează pe dispozitivele lor ATmegal conține de registre de uz general pe biți Pentru a se referi la ele, comenzile folosesc un câmp de biți care specifică registrul care trebuie utilizat Registrele sunt denumite de la R la R Registrele ATmegal au o particularitate: sunt prezente și în spațiul de memorie Octetul al spațiului de date este echivalent cu registrul R din setul Când o instrucțiune modifică R și apoi citește octetul de memorie , găsește noua valoare R în el În mod similar, octetul al memoriei corespunde lui R și așa mai departe, până la octetul R Schema de afișare este prezentată în fig Direct deasupra celor de registre de uz general, la adresele de memorie - , există de octeți de memorie rezervați pentru registrele dispozitivelor I/O, inclusiv dispozitivele interne ale unui singur cip sisteme Pe lângă seturi de registre, ATmegal are mai multe registre speciale, dintre care cele mai importante sunt prezentate în fig Registrul de stare conține (de la stânga la dreapta): bit de activare a întreruperii, bit de transport pe jumătate, v capitol despre comenzi NSCM la nivel de arhitectură Memoria programului IO DESPRE Registrul de stare (SREG) I T H SVNZ C înalt Adresa Indicator de stivă (SP) scăzut Adresa Orez Organizarea registrelor și a memoriei în ATmegal bit de semn, bit de depășire, steag negativ, steag zero și bit de suprascriere Semnificațiile tuturor acestor biți, cu excepția bitului de activare a întreruperii, CC) sunt calculate ca rezultat al operaţiilor aritmetice Bitul I al registrului de stare oferă posibilitatea de a activa/dezactiva global întreruperile Dacă bitul I este , toate întreruperile sunt dezactivate Resetarea acestui bit permite dezactivarea întreruperilor ulterioare ale unui comandant Setarea acestui bit permite orice întreruperi în așteptare, precum și pre? descoperiri care vor veni în viitor Fiecare dispozitiv este asociat cu un bit de activare a întreruperii Dacă bitul dispozitivului este setat împreună cu bitul global de activare a întreruperii I, dispozitivul poate întrerupe procesorul* Pointerul stivei SP conține adresa curentă a memoriei de date la care comenzile PUSH și POP își vor accesa datele (similar cu comanda Java Virtual Machine cu același nume din Capitolul ) Indicatorul de stivă este situat în memoria I/O la adresa Un octet de memorie de biți nu este suficient pentru a adresa de octeți de memorie de date, astfel încât pointerul de stivă este format din două locații de memorie adiacente Tipuri de date Toate computerele au nevoie de date Pentru multe sisteme informatice, sarcina principală este prelucrarea datelor financiare, industriale, științifice, tehnice și de altă natură În cadrul unui computer, datele trebuie să fie reprezentate într-o formă anume La nivelul arhitecturii setului de instrucțiuni sunt utilizate diferite tipuri de date Ele sunt descrise în această secțiune Problema cheie este disponibilitatea suportului hardware pentru un anumit tip de date Prin suport hardware se înțelege că una sau mai multe instrucțiuni se așteaptă să primească date într-un anumit format, și utilizatorul init, ns poate folosi alt format De exemplu, contabilii sunt obișnuiți să folosească semnul minus pentru numerele negative din dreapta, iar informaticienii din stânga Să presupunem că, în încercarea de a-l impresiona pe șeful, șeful centrului de calculatoare la o firmă de contabilitate a schimbat numerele din toate computerele, astfel încât bitul de semn să fie cel mai din dreapta (în loc de cel din stânga) Fără îndoială, acest lucru va face o mare impresie asupra șefului, deoarece tot software-ul va înceta să funcționeze Hardware ambele i brutărie necesită un format specific pentru numere întregi și va eșua în același mod dacă numerele întregi ajung într-un format diferit Acum luați în considerare o altă firmă de contabilitate care tocmai a intrat într-un audit al datoriilor federale (suma pe care guvernul o datorează I IIIA tuturor contrapărților) Aritmetica pe de biți nu va funcționa aici, deoarece numerele sunt mai mari de (aproximativ miliarde) O soluție posibilă este utilizarea a două numere întregi de de biți pentru a reprezenta fiecare număr, adică toți cei de biți Dacă mașina nu acceptă astfel de duble, toate operațiunile aritmetice asupra lor trebuie efectuate în software, adică aceste două părți pot fi localizate în memorie într-o ordine arbitrară, deoarece acest lucru nu este important pentru hardware Acesta este un exemplu de date iiii fără suport hardware și, prin urmare, fără implementare hardware În următoarele subsecțiuni, ne vom uita la tipurile de date care sunt acceptate de hardware și care necesită formate speciale Tipuri de date numerice Tipurile de date pot fi împărțite în două categorii: numerice și nenumerice Dintre tipurile de date numerice, principalele sunt numerele întregi Ele vin în cipuri diferite: de obicei , , și de biți Numerele întregi sunt folosite pentru a număra diverse articole (de exemplu, vă permit să aflați câte șurubelnițe sunt în stoc), pentru a identifica diverse obiecte (de exemplu, conturi bancare) și, de asemenea, în alte scopuri Majoritatea calculatoarelor moderne stochează numere întregi în formă binară, deși în trecut au fost folosite alte sisteme Numerele binare sunt discutate în Anexa A Unele computere acceptă atât numere întregi semnate, cât și nesemnate Nu există niciun bit de semn într-un întreg fără semn și toți biții conțin date Acest ID de date are avantajul că are un bit în plus, astfel încât un cuvânt de de biți poate conține un întreg fără semn de la la - inclusiv Un întreg binar cu semn, pe de altă parte, poate conține doar numere până la - , dar poate lua și valori negative Numerele în virgulă mobilă sunt folosite pentru a exprima numere care nu sunt întregi (de exemplu, ) Sunt descrise în Anexa B Lungimea lor este de , , ii uneori de biți Majoritatea computerelor au instrucțiuni pentru efectuarea operațiunilor cu numere în virgulă mobilă Multe computere au registre separate pentru operanzi întregi și pentru operanzi în virgulă mobilă Unele limbaje de programare (în special COBOL) acceptă reprezentarea zecimală a numerelor Mașinile proiectate pentru programele COBOL acceptă adesea numere zecimale în hardware pentru a face acest lucru o zecimală este codificată cu patru biți, iar apoi cele două zecimale sunt combinate într-un octet (format zecimal codificat binar) Cu toate acestea, rezultatele operațiilor aritmetice pe astfel de numere zecimale vor fi incorecte, așa că sunt necesare comenzi speciale pentru a corecta aritmia zecimală Aceste instrucțiuni trebuie să controleze transportul bitului Acesta este motivul pentru care codul de condiție conține adesea bitul de transport superior De altfel, problema Anului a fost cauzată de programatorii COBOL, care au decis că este mai economic să reprezinte anul ca două zecimale ( biți), mai degrabă decât ca un număr binar de biți sau cel puțin un număr binar de biți care poate reprezenta mai multe valori ( ) decât reprezentarea BCD împachetat ( ) Așa este "optimizarea"! Tipuri de date nenumerice Deși primele computere lucrau în principal cu numere, mașinile de astăzi sunt adesea folosite pentru a rula aplicații non-numerice, cum ar fi procesarea de text sau gestionarea bazelor de date Aceste aplicații necesită alte tipuri de date, nenumerice Ele sunt adesea susținute de instrucțiuni la nivelul arhitecturii setului de instrucțiuni Simbolurile sunt foarte importante aici, deși nu toate computerele oferă suport hardware pentru ele Cele mai comune coduri de caractere sunt ASCII și Unicode Aceștia acceptă caractere pe și, respectiv, pe biți Aceste coduri au fost discutate în capitolul La nivelul arhitecturii setului de instrucțiuni, există adesea instrucțiuni specifice pentru operațiuni cu șir Aceste șiruri sunt uneori delimitate de un caracter special la sfârșit În loc de un caracter terminal, câmpul lungime șir poate fi folosit pentru a defini sfârșitul unui șir Comenzile cu șiruri vă permit să copiați, să căutați, să editați șiruri și multe altele Non-numerice include, de asemenea, un tip de date logic foarte important care conține valori booleene Există doar două dintre aceste valori: adevărat și fals Teoretic, o valoare booleană poate fi reprezentată printr-un singur bit: este fals, este adevărat (sau invers) În practică, se folosește un octet sau un cuvânt, deoarece biții individuali dintr-un octet nu au propriile adrese și, prin urmare, sunt dificil de accesat Multe sisteme folosesc următoarea convenție: înseamnă fals și orice altă valoare înseamnă adevărată Singura situație în care o valoare booleană este reprezentată de un singur bit este într-o matrice de biți, deci un cuvânt de de biți poate conține de valori booleene O astfel de structură de date se numește bitmap sau bitmap Bitmapping-ul are loc în diverse contexte, de exemplu, vă permite să urmăriți blocurile libere de pe un disc - în acest caz, fiecare bit reprezintă starea fiecărui bloc Dacă discul conține n blocuri, atunci harta de biți va conține n biți Ultimul tip de date sunt pointerii, care sunt adrese de mașină Am luat deja în considerare indicii de multe ori Pe mașinile Mic-x, registrele SP, PC, LV și CPP sunt exemple de pointeri Accesarea unei variabile la o distanță fixă de indicator (care este modul în care funcționează comanda ILOAD) este acceptată pe scară largă de toate mașinile Pentru toată utilitatea lor, indicii ♦ Sunt cauza a numeroase erori, adesea cu consecințe foarte grave Când lucrați cu ei, este necesară prudență extremă Tipuri de date ale procesorului COGE i ♦ ui | acceptă numere întregi binare cu semn, întregi fără semn, format ixichio-zecimal și numere în virgulă mobilă IEEE/' (secțiunea ) Derivat din strămoșii de / biți, acest procesor funcționează cu numere stupide de aceeași lungime și date pe de biți și acceptă ♦ іінііег numeroase comenzi aritmetice, operații booleene și operații de egalizare În plus, procesorul poate rula în modul pe de biți și acceptă și registre și operațiuni pe de biți Operanzii w* trebuie aliniați în memorie, dar dacă adresele cuvintelor sunt multipli de octeți, procesorul rulează mai repede ІyAlice Tipuri de date numerice ale procesorului Coré I Tip biți biți biți biți Numere semnate Da Da Da Da ( de biți) ||і"іы<' numere nesemnate Da Da Da Da ( de biți) Numerele întregi cu zecimală unică Da Numere în virgulă mobilă Da Da ( ore i poate manipula și caractere ASCII pe biți: există comenzi speciale pentru copierea și căutarea șirurilor de caractere Aceste comenzi sunt folosite atât pentru șirurile a căror lungime este cunoscută dinainte, cât și pentru șirurile care se termină cu un caracter terminal special Comenzi șiruri sunt adesea folosite în biblioteci pentru a lucra cu șir de date Tipuri de date mașină OMAP i MLP acceptă multe formate de date (Tabelul ) Numai în domeniul întregului acest sistem poate gestiona operanzi semnati și nesemnați pe , și de biți Cu aceste tipuri de date "mici", OMAP este puțin mai inteligent decât Coré I Pe plan intern, OMAP este "o mașină pe de biți cu căi de date și instrucțiuni pe de biți Pe comenzile de încărcare și salvare, programul poate specifica dimensiunea și semnul valorilor care urmează să fie încărcate (de exemplu, comanda de încărcare a unui octet semnat: LDRSB) Valoarea este apoi convertită de comenzile de încărcare la o valoare compatibilă pe de biți În mod similar, instrucțiunile de stocare specifică, de asemenea, dimensiunea și semnul valorii care trebuie stocată și operează numai pe porțiunea specificată a registrelor de intrare (Numerele complementare semnate, doi În plus, există operanzi în virgulă mobilă pe și de biți care respectă standardul IEEE (pentru numere pe și de biți) Numerele BCD nu sunt acceptate Toți operanzii Tipurile de date caractere și ( i fatale nu sunt acceptate la nivel de instrucțiune - toate operațiunile cu acestea sunt efectuate exclusiv la nivel de software Tabelul Tipuri de date numerice ale computerului OMAP Tip biți biți biți biți Numerele întregi semnate Da La Da Numerele întregi fără semn Da Da Da Numerele întregi binare zecimale Numere în virgulă mobilă Da Da Tipuri de date ATmegal Numărul de tipuri de date din ATmegal este strict limitat Capacitatea tuturor registrelor - și, prin urmare, a numerelor întregi și a caracterelor - este de biți De fapt, singurul tip de date pentru efectuarea operațiilor aritmetice, care este suportat de hardware, este un octet de biți (Tabelul ) Tabelul Tipuri de date numerice pentru ATmegal Tip biți biți biți biți Numeri întregi semnate Da Numerele întregi fără semn Da Da Numerele întregi binare zecimale Numere în virgulă mobilă Pentru a simplifica gestionarea memoriei, ATmegal are, de asemenea, suport limitat pentru pointerii nesemnați pe biți Pointerii X, Y și Z de biți pot fi formați prin concatenarea perechilor de registre de biți R /R , R /R și, respectiv, R /R Când o operațiune de încărcare folosește X, Y și Z ca operand de adresă, procesorul poate, de asemenea, să crească sau să decrementeze valoarea cu opțional Formate de comenzi O instrucțiune constă dintr-un cod operațional și câteva informații suplimentare, cum ar fi de unde provin operanzii și unde ar trebui trimise rezultatele Procesul de determinare a locului în care sunt operanzii (adică, adresele lor) se numește adresare Pe fig Figura prezintă câteva formate posibile de comandă la nivel de arhitectură de set de comenzi Comenzile conțin întotdeauna un cod operațional O comandă poate conține niciuna, una, două sau trei adrese La unele mașini, toate comenzile au aceeași lungime, în altele pot fi diferite În plus, comenzile de lungime pot fi mai scurte decât un cuvânt, mai lungi decât un cuvânt sau egale cu un cuvânt Dacă toate instrucțiunile au aceeași lungime, atunci aceasta simplifică decodarea, dar necesită adesea spațiu inutil, deoarece toate instrucțiunile trebuie să aibă aceeași lungime ca cea mai lungă Pe fig Figura prezintă mai multe relații posibile între instrucțiune și dimensiunea cuvintelor formatele de comandă "w COD DE OPERARE COD DE OPERARE ABORDARE ADRESA ADRESA b Cod OPERAȚIE ADRESĂ ADRESĂ ADRESĂ A în g Orez Patru formate de comandă: comandă(e) neadresată(e); comanda unicast (b); comenzi cu două adrese; comandă cu trei adrese (g) - cuvânt cuvânt Echipa Echipa Echipa Echipa -W cuvânt - Echipa Echipa Echipa Echipa Echipa Echipa Echipa Echipa b Echipa Echipa Echipa Echipă Echipă A V Orez Câteva relații posibile între dimensiunea comenzii și a cuvintelor Criterii de proiectare a formatului de comandă Atunci când alege formatele de comandă pentru mașina sa, proiectantul trebuie să ia în considerare o serie de factori Nu trebuie să subestimăm complexitatea acestei soluții Dacă un computer are succes comercial, setul de instrucțiuni poate dura de ani sau mai mult Capacitatea de a adăuga noi echipe și alți clienți în timp este de mare valoare, dar numai dacă arhitectura (și compania care a creat arhitectura) durează suficient Eficacitatea unei anumite arhitecturi de instrucțiuni depinde de tehnologia utilizată pentru proiectarea computerului Pe o perioadă lungă de timp, tehnologia zga se va schimba semnificativ, iar unele caracteristici ale arhitecturii de comandă vor fi (dacă priviți în urmă cu de ani) nefericite De exemplu, dacă accesul la memorie este rapid, atunci o arhitectură de stivă va funcționa (ca în IJVM), dar dacă accesul la memorie este lent, atunci este de dorit să existe mai multe registre (ca în OMAP ) Pentru acei cititori care cred că alegerea este ușor de făcut, vă sugerăm să luați o bucată de hârtie și să scrieți următoarele* ipoteze: + Care va fi frecvența tipică a unui generator de ceas peste de ani? + Care va fi timpul obișnuit de acces la RAM în de ani? Îndoiți cu grijă această bucată de hârtie și ascundeți-o într-un loc sigur, iar după de ani, desfaceți-o și citiți ce este scris pe ea Cei mai încrezători în sine* își pot posta profețiile pe Internet i/iva o comenzi HBOA la nivel de arhitectură Desigur, chiar și dezvoltatorii prevăzători nu pot face întotdeauna alegerea corectă Și dacă ar fi putut, nu ar fi funcționat mult timp - dacă arhitectura echipelor pe care le pun la dispoziție s-a dovedit a fi mai scumpă decât cea a concurenților, compania nu va rezista, iar lumea nu va aprecia eleganța deciziilor luate eu În rest, echipele scurte sunt mai bune decât cele lungi Un program care constă din n instrucțiuni de biți ocupă jumătate din spațiu de memorie decât un program de n instrucțiuni de de biți Pe măsură ce prețurile memoriei post-smc|I cresc, acest factor poate deveni mai puțin important în viitor, dar, din păcate, software-ul ssmc crește mult mai repede decât prețurile scad eu În plus, reducerea la minimum a dimensiunii instrucțiunilor le poate face mai dificil de decodat și executat în paralel Prin urmare, dorința de a reduce dimensiunea comenzilor IC trebuie echilibrată de dorința de a reduce timpul de decodificare și execuție a acestora R Există un alt motiv foarte important pentru minimizarea lungimii instrucțiunilor, iar OM devine mai important pe măsură ce viteza procesorului crește: lățimea de bandă a memoriei (numărul de biți pe secundă pe care îl poate oferi memoria) Creșterea semnificativă a vitezei procesorului în ultimul deceniu nu se potrivește cu creșterea lățimii de bandă a memoriei Limitările aici se datorează incapacității sistemului de memorie de a transfera comenzi și operanzi la aceeași viteză cu care procesorul le poate procesa! Lățimea de bandă a memoriei depinde de tehnologia de dezvoltare Dificultățile întâlnite pe parcurs sunt legate nu numai de memoria principală, ci și de CR-ul tuturor tipurilor de memorie cache Dacă lățimea de bandă a memoriei cache de instrucțiuni este de t bps și lungimea medie a instrucțiunii este de /bit, atunci memoria cache este capabilă să transmită cea mai mare I/g de instrucțiuni pe secundă Rețineți că aceasta este o limită superioară a vitezei la care procesorul poate executa instrucțiuni, deși în prezent se încearcă depășirea acestei bariere Este clar că rata la care pot fi executate instrucțiunile (adică viteza procesorului) poate fi limitată de lungimea instrucțiunilor Cu cât instrucțiunile sunt mai scurte, cu atât mai repede rulează procesorul I Deoarece procesoarele moderne sunt capabile să execute mai multe instrucțiuni într-un ciclu, apelarea mai multor instrucțiuni pe ciclu este obligatorie Acest aspect al utilizării cache-ului de instrucțiuni face ca dimensiunea instrucțiunii să fie un aspect important de proiectare Un alt criteriu este că există suficient spațiu în formatul instrucțiunii pentru a reprezenta toți operanzii necesari O mașină care acceptă operații nu poate avea o lungime a instrucțiunii mai mică de n biți În acest caz, nu ar exista suficient spațiu în codul operațional pentru a indica ce comandă este necesară În plus, istoria a dovedit din nou și din nou cât de neînțelepți au fost designerii să lase coduri operaționale gratuite pentru adăugiri viitoare la setul de instrucțiuni Al treilea criteriu este legat de numărul de biți din câmpul de adresă Luați în considerare un design de mașină cu caractere de biți și memorie principală care ar trebui să conțină de caractere Dezvoltatorii pot alege să asocieze adrese secvențiale cu blocuri de , , sau de biți Imaginează-ți ce s-ar întâmpla dacă echipa de dezvoltare s-ar împărți în două grupuri în război, dintre care unul pretinde că unitatea principală Formate de comenzi sus Trebuie să fie un octet de biți, în timp ce celălalt necesită ca unitatea de memorie de bază să fie un cuvânt de de biți Primul grup ar sugera o memorie numerotată , , , , , Al doilea grup ar sugera ( cuvinte cu numerele , , , , , Celălalt grup va spune că, pentru a compara două caractere cu org și cuvinte de de biți, programul trebuie nu numai să apeleze cuvintele ngi care conțin aceste caractere, ci și să extragă pe cel corespunzător din fiecare cuvânt pentru comparație Și acest lucru va necesita co-urmărire suplimentară, spațiu suplimentar Organizarea pe biți, iv, asigură că fiecare caracter este adresat, ceea ce simplifică foarte mult comparația Persoanele cu organizație pe de biți vor spune că designul lor necesită doar adrese separate, ceea ce va oferi o lungime a adresei de numai de biți, în timp ce aceeași organizație necesită până la de biți pentru a accesa aceeași Dacă adresa este scurtă, atunci comanda va fi mai scurtă Va ocupa spațiu în memorie și, în plus, va necesita din ce în ce mai puțin pentru a-l apela De asemenea, adresele pe de biți pot fi folosite pentru a adresa i și în GB în loc de aproximativ GB Acest exemplu demonstrează că pentru a obține o discretitate optimă sunt necesare adrese mai lungi și, prin urmare, comenzi mai lungi O extremă este organizarea memoriei la care este adresat fiecare IT (de exemplu, Burroughs B ) La cealaltă extremă se află memoria formată din cuvinte foarte lungi (de exemplu, seria CDC Cyber conținea eLox-uri pe de biți) Sistemele informatice moderne au venit cu un compromis care, într-un fel, combină cele mai proaste calități ale ambelor opțiuni Ei necesită octeți individuali pentru a avea adrese, dar atunci când accesați memorie, unul, doi și uneori chiar patru cuvinte sunt întotdeauna citite simultan De exemplu, ca urmare a citirii unui octet din memorie pe o mașină Core I , sunt apelați la un moment dat cel puțin octeți și, uneori, întreaga linie cache de de octeți Extindere opcode În subsecțiunea anterioară, am văzut că adresele scurte și o rezoluție bună a memoriei se pot contrazice În această secțiune, vom analiza compromisurile asociate cu codurile operaționale și adresele Luați în considerare o instrucțiune de dimensiune n + k biți cu un opcode de k biți și o adresă de n biți O astfel de instrucțiune permite k operațiuni diferite și " locații de memorie adresabile Alternativ, aceiași n + k biți pot fi împărțiți într-un cod de operare de k - biți și o adresă de n + biți dar de două ori mai multă memorie, sau aceeași cantitate de memorie, dar discretitatea este de două ori mai mare Un cod de operare de k + biți și o adresă de n - biți oferă mai multe operații, dar va trebui să plătiți pentru asta fie prin reducerea numărului de memorie celule, sau rezoluție nu foarte bună pentru aceeași cantitate de memorie În plus față de aceste simple compromisuri între biții opcode și biții de adresă, există altele mai complexe Mecanismul discutat aici se numește extindere opcode ^ѵ"p ardiiikgurm ECHIPA NaOORYA Conceptul de extensie opcode poate fi explicat printr-un exemplu Luați în considerare o mașină cu instrucțiuni lungi de biți și adrese de biți, așa cum se arată în Fig Acest lucru este destul de rezonabil pentru o mașină care conține registre (și, prin urmare, o adresă de registru de biți) cu care să efectueze operații aritmetice O opțiune este să includeți un cod operațional pe biți și trei adrese în fiecare instrucțiune, rezultând instrucțiuni cu trei adrese Opcode Adresa Adresa Adresa Orez Instrucțiuni cu opcode pe biți și trei câmpuri de adresă de biți Dacă dezvoltatorii au nevoie de instrucțiuni cu adrese, instrucțiuni cu adrese, de instrucțiuni unicast și instrucțiuni fără adresă, ei pot utiliza codurile operaționale de la la ca instrucțiuni cu adrese și pot interpreta codul operațional diferit (Figura ) Aceasta înseamnă că codul operațional este conținut în biții de la la , nu de la la Biții de la la și de la la formează două adrese ca înainte Toate cele instrucțiuni cu două adrese conțin numărul în cei patru biți înalți și numerele de la la în biții la AND Sunt considerate instrucțiunile cu numărul în cei patru biți înalți și numărul sau în biții la AND separat Ele sunt interpretate ca și cum codurile lor operaționale sunt în biții de la la Rezultatul este de coduri operaționale noi Și deoarece sunt necesare doar de coduri, codul înseamnă că codul operațional real este în biții de la la , ceea ce oferă comenzi neadresate După cum puteți vedea, codul operațional devine din ce în ce mai lung: instrucțiunile cu adrese au un cod operațional de biți, instrucțiunile cu două adrese au un cod operațional de biți, instrucțiunile unicast au un cod operațional de biți și instrucțiunile fără adresă au un opcode pe biți Ideea de a extinde codul operațional demonstrează clar compromisul dintre spațiul pentru coduri operaționale și spațiul pentru alte informații Cu toate acestea, în practică, totul nu este la fel de simplu și clar ca în exemplul nostru Există doar două moduri de a modifica dimensiunea codului operațional Pe de o parte, este posibil să aveți toate instrucțiunile de aceeași lungime, prin atribuirea celor mai scurte opcodes acelor instrucțiuni care au nevoie de cei mai mulți biți pentru a specifica altceva Pe de altă parte, puteți minimiza dimensiunea medie a instrucțiunilor alegând cele mai scurte coduri operaționale pentru instrucțiunile utilizate frecvent și cele mai lungi pentru cele utilizate rar Pentru a duce această idee la extrem, puteți minimiza lungimea medie a instrucțiunii prin codificarea fiecărei instrucțiuni pentru a minimiza numărul de biți necesari Din păcate, acest lucru duce la prezența instrucțiunilor de diferite dimensiuni și nealiniate pe granițele octeților Atâta timp cât există arhitecturi de instrucțiuni cu această proprietate (de exemplu, Intel ), alinierea va fi de mare importanță pentru decodarea rapidă a instrucțiunilor Cu toate acestea, această idee Opcode pe biți biți ■Taxa) xxxx UUUU xxxx uuuu xxxx uuuu xxxx uuuu xxxx uuuu xxxx uuuu comenzi triade Ѳ-digit cod de operare < ) UUUU uuuu uuuu uuuu Q UUUU uuuu comenzi cu două adrese Opcode pe biți < ) de comenzi unicast Opcode pe biți * < ) comenzi neadresate Număr de biți Orez Extensia opcode oferă instrucțiuni cu trei adrese, instrucțiuni cu două adrese, instrucțiuni unicast și instrucțiuni fără adresă Câmpurile xxxx, yyy și zzzz sunt câmpuri de adresă pe biți aplicat pur la nivel de octet În continuare, ne vom uita la arhitectura instrucțiunilor JVM pentru a arăta cum pot fi modificate formatele de instrucțiuni pentru a minimiza dimensiunea programului cât mai mult posibil ■ <■■■" și griam architecture ikora comenzi Formate de comandă ale procesorului Core i L Formatele de instrucțiuni ale procesorului Core i sunt foarte complexe și neregulate Acestea conțin până la șase câmpuri de lungimi diferite, dintre care cinci sunt opționale (CWID-ul general este prezentat în Figura ) Această situație a apărut din cauza faptului că arhitectura PR a evoluat de-a lungul mai multor generații și anterior includea opțiuni de comandă de mare succes Datorită cerinței de compatibilitate inversă, DI-urile nu au putut fi modificate ulterior De exemplu, dacă unul dintre operanzi este în memorie, atunci celălalt nu poate fi acolo Ca rezultat, există instrucțiuni pentru adăugarea a două registre, instrucțiuni pentru adăugarea unui registru la un STRAT de memorie, instrucțiuni pentru adăugarea unui cuvânt de memorie la un registru, dar nu există un CLC pentru adăugarea unui cuvânt de memorie la un alt cuvânt de memorie MOD REG R/M MOD REG R/M Orez Formate de instrucțiuni Core i În arhitecturile timpurii Intel, toate codurile operaționale aveau dimensiunea de octet, deși un așa-numit octet de prefix era adesea folosit pentru a modifica unele instrucțiuni Un octet de prefix este un cod operațional suplimentar care este plasat înaintea unei instrucțiuni pentru a-și schimba efectul Un exemplu de utilizare a octetului de prefix este comanda largă pe mașinile IJVM Din păcate, la un moment dat, Intel a rămas fără coduri operaționale, iar un cod operațional, OxFF, a devenit un cod de serviciu care indică prezența celui de-al doilea octet al instrucțiunii Biții individuali ai codurilor operaționale Core i oferă foarte puține informații despre instrucțiune Singura structură de acest fel din câmpul opcode este bitul cel mai puțin semnificativ din unele instrucțiuni, care indică ce cuvânt sau octet este numit și bitul adiacent, care indică dacă adresa de memorie (dacă există) este sursa sau destinația Astfel, în cele mai multe cazuri, opcode-ul trebuie să fie complet decodat pentru a determina cărei clase îi aparține operația efectuată și, prin urmare, cât de lungă este instrucțiunea Acest lucru reduce foarte mult performanța, deoarece decodarea trebuie făcută chiar înainte de a se determina începerea următoarei instrucțiuni Formate de comandă "" Cele mai multe instrucțiuni, după octetul opcode, care indică jfct*TOHli operandului unde operandul este în memorie, este urmat de un al doilea octet care poartă toate informațiile despre operand Acești biți sunt distribuiți pe un câmp MOD de biți și două câmpuri de registru I-bit REG și R/M Uneori, primii biți ai acestui octet sunt IPio iiizu ot ca extensie pentru codul operațional, adăugând biții AND DAYS ai codului operațional Totuși, un câmp de biți înseamnă că există doar moduri de a accesa operanzii, iar unul dintre operanzi trebuie să fie întotdeauna în al doilea registru Oricare dintre registrele AX trebuie să fie identificat logic EBX, ECX, EDX, ESI, EDI, EBP, ESP, dar regulile de codificare a comenzilor IIP interzic unele combinații care sunt rezervate pentru cazuri speciale Alte tipuri de comenzi necesită un octet suplimentar numit SIB (Scale, llidrx, Base) care oferă o specificație suplimentară Această schemă nu este perfectă, este un compromis între cerința de compatibilitate inversă și dorința de a ține cont de noi caracteristici care nu au fost avute în vedere inițial În plus, unele instrucțiuni au , sau octeți suplimentari /im din definiția adresei instrucțiunii (offset) și uneori alți , sau octeți care conțin o constantă (operand imediat) Formate de comandă pentru procesorul OMAP Arhitectura de instrucțiuni OMAP constă din instrucțiuni pe și de biți aliniate în memorie Comenzile sunt foarte simple Fiecare dintre ei va efectua o singură acțiune O instrucțiune tipică specifică două registre în care se află operanzii sursă și un registru de ieșire Comenzile pe biți sunt versiuni simplificate ale comenzilor pe de biți Ei efectuează aceleași operații, dar permit doar doi operanzi de registru (există un registru de destinație care trebuie să se potrivească cu una dintre surse), și doar primii registre pot fi specificati ca intrare Designerii arhitecturii ARM au dat acestei versiuni simplificate a setului de instrucțiuni ARM denumirea "Thumb" În loc de unul dintre registre, instrucțiunea poate folosi o constantă fără semn pe , , , sau de biți Când o instrucțiune LOAD este executată, se adaugă două registre (sau un registru și o constantă de biți semnată) pentru a determina adresa de memorie care trebuie citită Datele de acolo sunt scrise într-un alt registru specificat în comandă Formatul de instrucțiuni ARM pe de biți este prezentat în Figura Cititorul atent va observa că unele formate constau din aceleași câmpuri (de exemplu, AND )NG MULTIPLY și SWAP) În cazul unei instrucțiuni SWAP, decodorul știe că are de-a face cu o instrucțiune SWAP numai dacă vede că combinația de valori de câmp pentru MUL este invalidă Au fost adăugate formate suplimentare pentru extensiile Thumb și arhitectura La momentul scrierii, există de formate de echipă, iar numărul este în creștere (Cât timp trebuie să așteptăm ziua în care apare reclama pentru "cel mai complex procesor RlSC din lume"?) Cu toate acestea, majoritatea echipelor continuă să folosească formatele prezentate în figură Capitolul Stratul de arhitectură al setului de instrucțiuni Cond I Cod operare S Rn Rd Op-rand Cond A S Rd Rn RS Rm Cond și A S RdHi RdLo RS Rm Cond 